Благодаря трудам ученых из университета в Иллинойсе, машины смогут вскоре научиться понимать математические понятия, скрытые в природном языке. Профессор Дэн Рот и его студент Сабро Рой работают над программой, которая позволит компьютеру понять предложение, сказанное человеком: «У Яна есть пять яблок и семь апельсинов. Он хотел бы разделить их поровну между тремя друзьями. Сколько частей каждого фрукта получит каждый из них?»
Ученые представили результаты своих исследований в журнале «Труды ассоциации вычислительной лингвистики» и заявили, что если бы машины смогли понимать такого типа формулировки, это очень бы упростило поиск нужной информации в сети, облегчило бы доступ к огромным базам данных и даже улучшило бы качество математического образования.
В архивах печатных сервисов и других массовых хранилищах информации находится колоссальное количество данных, но в настоящее время у нас нет простого способа получить доступ к этим данным. Например, если кто-нибудь захотел бы узнать, какой процент своего бюджета израсходовал конкретный штат на образование на протяжении последних 20 лет, то такой вопрос, заданный поисковику, не дал бы никаких результатов. «Но если бы компьютеры понимали количественные выражения, то знали бы, что ищет пользователь. Они могли бы найти соответствующие цифры и произвести подсчеты,» – говорит Рот. Ученый отмечает, что самой трудной задачей является обучить машину идентифицировать количество и понятия, несмотря на то, каким образом они были выражены в тексте. Люди могут делать это подсознательно. Далее программное обеспечение должно будет решить, что требуется сделать с найденными числами. В предложении о Яне компьютер должен будет понять, что яблоки и апельсины – это фрукты, что слова «пять», «семь» и «три» – это соответствия чисел, и в итоге он должен знать, какие математические операции и в какой последовательности должен выполнить. Проблемой, таким образом, является понимание и перевод предложения в соответствующее равенство. Когда это будет сделано, у машины не будет никаких трудностей с решением задачи. Компьютер должен понимать также те операции, которые Ян хочет произвести. Это значит, что в одном случае он может разделить фрукты только между своими друзьями, а во втором случае – оставить одну часть еще и себе.
Машина должна понимать также и контекст. Если компьютеру попадется выражение «два фунта», то он должен знать, о какого рода фунтах идет речь, ведь это может быть и фунт стерлингов, и фунт как мера веса. Ученые сообщили, что протестировали свое программное обеспечение на различных текстах, в которых оно искало информацию, касающуюся валютных величин, и на их основе решало задачи начальной школы. При этом в словесных задачах компьютер разбирался быстрее, чем ученик начальной школы, успешно решая 87% из них.