Экс-владелец "Мастерхоста" и владелец Openstat Леонид Филатов готовит с новыми партнерами технологию смыслового распознавания текстов. На днях простейшая версия этой разработки стала доступна для тестирования на index.ru.
В нынешнем виде index.ru - это интерфейс для тестирования точности распознавания смысла текста. В качестве дерева категорий используется русскоязычная "Википедия" (около 800 тыс. объектов и 3,5-4 млн. диагностик, описывающих их отношения). Алгоритм выделяет в произвольных текстах главное и выдает список категорий, к которым может относится этот текст.
Партнером Филатова в этой истории (и, собственно, ее идеологом) выступает Валерий Бардин, стоявший у истоков российского интернета, и его нынешняя компания "Релтим". На основе технологии онтологического анализа данных они разрабатывают "умный поиск" Gitika.
Но еще один поисковик не самоцель, говорит Филатов, очевидные "продуктовые" решения на основе их технологии включают фильтрацию контента в Интернете, более релевантную контекстную рекламу, создание тематических карт контента (например, разметка больших текстовых архивов тегами) и т.д.
Вдобавок, по информации Roem.ru, Филатов ведет переговоры о сотрудничестве с компанией, занимающейся автораспознаванием (и преобразованием в текст) аудиовизуального контента - очевидно, в расчете на перспективы синергии этих двух алгоритмов.
Можно сделать вывод, что в начале выдаются гипотезы для разных онтологий. Значимые гипотезы приобретают больший вес. Краткий итог в конце.