Информатик, купленный недавно Ашмановым, гордо рапортует о выходе новой версии ОРФО 2010, системы проверки правописания. Я давно не могу понять, зачем вообще нужны подобные системы? Офисные программы сами проверяют орфографию, браузеры тоже проверяют, даже большинство вебдванольных сайтов проверяет ошибки при написании постов и каментов. В крайнем случае есть сайт gramota.ru - и всё это бесплатно, в отличие от.
Лучшие комментарии
Контекст комментария Игорь Ашманов Сам себе компания
Добавить 43 комментария
- Ответить
радует описание .. — Автоматическое добавление в СЛОВНИК новых слов во всех словоформах. … это типа собственный словарь ? :) и НЕТ версии под Мак . НЕТ под линукс. Вернее так.. есть ТОЛЬКО под винду :) и кстати действительно обычный блок текстареа в моем фаерфоксе с версии 3.х подчеркивает ошибки и предлагает их исправить как в офисном ворде :)
- Ответить
Довольно давно пользуюсь этой программой. По моим впечатлениям ни одна другая программа не проверяет русский язык лучше чем ОРФО. Та ОРФО, которую майкрософт купила у Информатика в далеких девяностых, и встраивает в ворд безнадежно устарела. Для меня ОРФО это не только проверка правописания. В ОРФО есть полезные словари, поиск и замена во всех словоформах, чего нет например в ворде. Мне как человеку работающему с текстами, последние две функции особенно важны.
- Ответить
Орфография то ладно, пунктуацию хоть одна программа в мире умеет проверять? Если нет таких, забирайте название для будущей разработки — ПУНКТУ 2011.
- Ответить
> браузеры тоже проверяют Пытаются проверять. С довольно ужасным качеством. В связи с чем вопрос: а ОРФО, собственно, поддерживает проверку орфографии в ФФ или Хроме?
- Ответить
А чем браузеры и редакторы проверяют, а? В Firefox стоит свободный Aspell. А вот Word пользуется движком…кого бы вы думали? ОРФО, можете посмотреть в окне «О программе». Да только там движочек точно не 2010го года. Сайты же свои движки проверки орфографии тоже не пишут. :-) Это нужно. Но всё-таки это надо развивать. Информатик пытается дорабатывать морально устаревший ОРФО. Которого реально нет ни в Linux, ни в Mac, ни на мобильниках (а там он был бы ой как нужен). Который даже на Виндах идёт только как надстройка к Office (да, он ещё пытается худо-бедно работать на текстовых полях…). Вообще, они не работают над новыми штуками. В каком году вышел седьмой КонТекст? И есть ли там поддержка Windows Vista и 7? И есть ли у них хоть что-нибудь, кроме доработанных программок с диска «Софт под Win95 для офиса»? Как они ещё на плаву держатся, это удивительно.
- Ответить
Зря prohodilmimo на добавление в словник наехал. В ворде меня раздражало вводить в ручную все модификации слова в пользовательский словарь. Пока добавишь новое слово поседеешь, а видеть одно и тоже слово неизвестное проверялке, при том часто используемое в документах, подчеркнутым сильно раздражает. А самое обидное когда ошибешься при вводе форм слова. Вообще, если честно, не понимаю почему мелкомягкие такую простую функцию у себя повторить не могут.
- ОтветитьИгорь Ашманов Сам себе компания
Поясню: 1) Про «офисные программы сами проверяют». Ну да, типа с помощью ОРФО и проверяют. До этой версии МС Офиса-2010 проверка в Ворде и была собственно ОРФО. Микрософт в 1994 — 2007 гг. регулярно, для каждой версии Офиса, лицензировал у Информатика четыре модуля — правописания (красные волнистые линии), переносы, тезаурус (синонимы-антонимы), грамматика и стиль (зелёные волнистые линии). К сожалению (или к счастью) в последний раз при заключении договора на ОРФО с Микрософтом прежние менеджеры Информатика зачем-то продали Микрософту не библиотеку правописания и тезауруса, как обычно, а сами словари. И программисты МС сами написали спеллер и тезаурус над ними. Так что теперь в Офисе — спеллер собственной разработки. И только граммер/стиль от Информатика. На наш взгляд, качество проверки в Офисе-2010 значительно упало, так что для ОРФО это скорее хорошо, это рыночный шанс. Как именно упало — на то есть у нас целый аналитический документ, я подумаю, где его выложить. Например, ОРФО проверяет согласованность частей в словах с дефисом, а спеллер от МС для простоты считает, что любые два слова через дефис — правильно. Для русского языка это очень стрёмное правило, пропускающее кучу частых ошибок. Кстати, последние лингвистические инновации от МС в Офисе 2007 были такие: в словаре не было слов «дурак, дурацкий, стерва, дрянь, негр, голубой» и сотен прочих «оскорбительных» слов. Это политкорректные менеджеры заставили их выбросить из словаря ОРФО. Для Микрософта это обычный ход бюрократического процесса. 2) Неужели продаётся? Мы купили Информатик в мае 2010, сейчас выпустили свежую, пополненную версию ОРФО-2010. ОРФО по отдельности и раньше продавалась — даже при наличии ОРФО в Офисе, а теперь вообще идёт на ура, потому что МС ухудшил качество. В общем, крупные компании, связанные с издательским процессом, знают, что надо брать профессиональный продукт, а не попсу. Кроме того, у иностранных представительств в России есть потребность проверять итальянские/немецкие/испанские тексты вперемешку с русскими, этого вроде в Офисе делать нельзя. 3) Про пополнение словаря во всех формах. В Офисе вы должны щёлкать «добавить в словарь» по всем словоформам неизвестного слова. Например, для слова «трансглюкировать» или «неполиткорректный» придётся добавить форм 10-15. В ОРФО можно его добавить один раз во всех формах, это удобнее и быстрее. 4) Спеллеры в браузерах. Ну, вообще они негодные. Сделаны обычно на коленке. Проверяют с ошибками, пропусками, ложными срабатываниями. С нелепыми подсказками типа «Яндекс — недокись». Ну вот слвоа «Микрософту, лицензировал, попсу» — у меня сейчас Файрфокс подсвечивает, а опечатку «слвоа» — то подсвечивает, то нет. Ну, для бесплатных сгодятся. Вам нравится — используйте. Мы планируем выпустить в ближайшие полгода свой бесплатный пакет для браузеров — с хорошим качеством. 5) Нормальный русский спеллер для Мака. Да, его там нет вообще. Уже лет 20. Это реально прореха в мироздании. Мы сделаем спеллер для виндового Опен Офиса в ближайшие пару месяцев и спеллер для Мака и Линуха в ближайшие полгода. 6) Грамота.ру. Насколько я понимаю, на Грамоте проверяются отдельные слова, по словарям, в исходной форме (как в словаре), но нет проверки текстов или слов в косвенной форме. Есть свой спеллер на Яндексе, он основан на словаре ОРФО, купленном год назад у старых владельцев Информатика, ну и на своих словарях и статистических данных из поиска. На мой взгляд, проверяет пока не очень. Опять же, для интернет-текстов — сойдёт. Короче говоря, ОРФО нужна тем, кому требуется «настоящая» орфография для настоящей работы с ответственными текстами. Кроме того, ОРФО — живой продукт. То есть постоянно пополняется профессионалами, что про другие спеллеры часто можно сказать только с большой натяжкой. Ну и грамматику/стиль(в том числе знаки препинания и согласования падежей, стилистические ошибки типа «подъезжая к городу, слетела шляпа») не проверяет больше никто. Конечно, наследство нам досталось ржавое и скрипящее, которым мало занимались последние лет пять, но мы его уже почистили и смазали, сейчас начнём менять ходовую, кузов и т.п. Сама по себе ОРФО — лимузин среди дешёвых Жигулей, так что зачем её покупать — понятно.
- Ответить
Не трогайте ОРФО своими грязными пальцами — это была легенда во времена ДОСа ( когда еще файфокс не умел проверять правописание ) . ЭТО ЛЕГЕНДА !!! ЗЫ: правда оно и тогда стоило денег — видимо из-за этого и умерло
- Ответить
Кто умер? Вроде как новую версию выпустили, и до этого вполне бодренько версии клепали. Вот с маркетингом и у Информатика беда большая. Продукту уж скоро двадцатик стукнет, а про него только узкая тусовка знает. Относительно бесплатности альтэрэга зря. Офис вроде как у всех стоит, а сколько за него баблусики заплатило? По сему программа с вордом абсолютно бесплатно шла.
- Ответить
> и спеллер для Мака и Линуха в ближайшие полгода Игорь, мой вам совет — не тратьте усилий на Линукс, а потратьте на Mac/iPhone/iPad. Североамериканский рынок очень большой, а главное пользователи Мака привыкли покупать софт (правда относительно недорого), в отличие от линуксоедов.
- Ответить
>Игорь, мой вам совет — не тратьте усилий на Линукс, а потратьте на Mac/iPhone/iPad Дадада, действительно, ну их линуксоидов и серверный парк, под управлением этой ос, тоже не нужен, давайте всё для яблок делать. Было бы совсем шоколадно, если бы вы помимо «индивидуальных» вариантов выпустили бы и акисметоподобный веб-сервис.
- ОтветитьВалентин Домбровский Travelabs
> Не трогайте ОРФО своими грязными пальцами — это была легенда во времена ДОСа ( когда еще файфокс не умел проверять правописание ) . ЭТО ЛЕГЕНДА !!! Это Вы Ашманову, который участвовал в разработке ЛЕГЕНДЫ? :) И раз ЛЕГЕНДА, то дорабатывать уже не надо? Этак мы застрянем в каменном веке. :)
- ОтветитьЖомарт Амирханов GreenPR Kazakhstan
Если выпустите бесплатный пак для браузеров, это будет классно, а то Хром запарил подчёркивать слова с «ё».
- Ответить
Ashmanov, а как на счёт веб сервиса, есть желание сделать? :) Кинул монетку — получил неделю использования. Можно и в социальную сеть запихать, вещь полезная, многим бы понравилась, да и реклама продукту хорошая. Если будет желание сделать социальную версию, могли бы скооперироваться.
- Ответить
Ashmanov, поясню: у меня в контакте есть популярное приложение(«Переводчик» 4+ миллиона пользователей, около 200к ежедневных). Тематика схожая т.е. раскрутить подобный сервис было бы проще в соавторстве. :)
- Ответить
Ашманову Сейчас благодаря таким компаниям как гугл и даже яндекс очень популярны статистические методы обучения машин грамотности. На огромном текстовом корпусе учится языковая модель и далее все, что ей соответствует объявляется правильным, а все что не соответствует неправильным Вы применяете статистические методы или «грамматические» (на основе правил морфологии) Как вы думаете, в применении к русскому языку какие наиболее слабые и сильные стороны у статистических методов обучения машины грамотности.
- ОтветитьИгорь Ашманов Сам себе компания
Это долгий разговор, но можно навскидку сказать следующее: а) применяя статистику по большим массивам интернет-текстов, вы подменяете норму средним. То есть возводите узус, среднее употребление, в ранг нормы. На мой взгляд, норма и среднее — разные вещи и путать их нельзя. Например, в Японии среднее зрение, условно говоря, -3 диоптрии, а нормой по-прежнему является стопроцентная зоркость. Когда узус будет признан нормой Институтом русского языка, вот тогда он и станет нормой. Это происходит с часто употребляемыми новыми формами и словами, но не со всеми. Некоторые неологизмы, жаргонизмы становятся частотными на 5-7 лет, а потом бесследно исчезают. Фиксировать их в спеллере — неправильно, потому что спеллер может фиксировать норму на десятки лет. б) Кроме того, есть подозрение, что свои статистические нормы поисковики берут не из книг или справочников, а в основном из Интернета, а там норма письменной речи размыта сильнее всего. Таким образом, в спеллере может фиксироваться не грамотность, а наоборот, неграмотность. Мне кажется, никакой статистикой нельзя достоверно выявить тот факт, что фраза "переходя улицу, каблуки вязли в горячем асфальте" — ошибочная. Это вопрос именно правил. в) С другой стороны, статистические методы на большом корпусе могут помогать различать правильное написание на основе контекста. Таких случаев в проверке правописания много. Если поисковик использует какие-то контексты вокруг проверяемого слова, он может получить преимущества в проверке правописания. Если, конечно, это происходит на платформе письменной нормы. На мой взгляд, надо для спеллера изначально брать словари и грамматические правила и пытаться дополнительно шлифовать их статистикой.
- Ответить
Кроме того, есть подозрение, что свои статистические нормы поисковики берут не из книг или справочников, а в основном из Интернета, а там норма письменной речи размыта сильнее всего Может это хорошо? Например, «превед» и «медвед» стали нормой русского языка, много текстов в интернете подтверждают это. Яндекс и гугл считают их уже совершенно правильными словами, а филологи в университетах до этого дойдут только лет через двадцать
- Ответить
НАВЕРНОЕ, не только лингвистика, но и вся наука в целом должна стать статистический Например, есть привидения. Много людей в интернет подтверждают это. Пишут страничку, свидетельские показания, рассказы очевидцев, мутные фотки. Не может это быть неправдой, в интернет же написано! Столько народу пишет. Значит правда. Внесем в научную мысль.
- Ответить
медведы и преведы уже давно маргинальны, их век закончился через пару лет после появления а аццкую сотону вы уже не знаете, как правильно пейсать
- Ответить
http://blogs.yandex.ru/pulse/?period=20010601-20100914&query0=&query1=&query2= Отчётливо видно, что прошли те времена. Да, честно — уже и не помню, да и незачем — шутка себя исчерпала.
- ОтветитьВалентин Домбровский Travelabs
Zhiz0id, а зачем комменты потёрли? (не беспокойтесь я никому не скажу, что мне пришло на почту :)).
- ОтветитьВалентин Домбровский Travelabs
> НАВЕРНОЕ, не только лингвистика, но и вся наука в целом должна стать статистический Очень смешно, НО лингвистика как раз таки изучает явление, которое напрямую зависит от повседневной жизни. Если бы язык не развивался, мы бы до сих пор общались на праиндоевропейском. ;) Впрочем, к Орфо это отношения не имеет — он действительно должен фиксировать то, что уже является нормой, а установление норм — не его задача.
- Ответить
Psycho, комментарии к теме топика отношения прямого не имели и дальнейшие обсуждения особо не интересовали.
- ОтветитьВалентин Домбровский Travelabs
Отличный пример современного юзверя являет собой umkalive — именно про таких написано знаменитое чеховское «Проезжая мимо станции, с меня слетела шляпа». Впрочем, в данном случае umkalive спросил бы у Антон Палыча, где же здесь ошибка. Впрочем, umkalive не одинок — нынче правильное использование деепричастных оборотов необязательно даже для теледикторов, которые когда-то были образцами грамотной речи… :(
- ОтветитьИгорь Ашманов Сам себе компания
переходя улицу, каблуки вязли в горячем асфальте Здесь у деепричастия и глагола разные субъекты: вязли каблуки, а переходила хозяйка каблуков. Так же как станцию проезжал хозяин шляпы, а слетела шляпа. На Роеме так пишут постоянно: «зайдя на сайт, форма заявки не открывается». Таких типов ошибок в ОРФО сотни. Там есть специальный язык описания ошибок с разными грамматическими кванторами типа *SUBST (GEN) (любое существительное в родительном падеже) и тому подобных. Когда-то при создании стилистического корректора я два года подряд (1992-1993) читал каждое утро Московский Комсомолец с карандашом в руках. Он был самый урожайный на стилистические ошибки типа «играть значение»,»дешёвые цены» и т.п. — по тридцать новых ошибок и типов ошибок на номер. С тех пор не могу видеть эту газету. Думаю, сейчас в ней не много изменилось.
- ОтветитьИгорь Ашманов Сам себе компания
Вызываю Синодова: Юра, ошибка: после редактирования формат коммента становится просто текстовым, и теги не работают.
- Ответить
> вязли каблуки, а переходила хозяйка каблуков. Как вы определили, что это была особь женского пола? Мне почему-то виделось, что это цитата из известного триллера "Очумевшие каблуки Ашманова", и выступают они здесь как одушевленная субстанция. Однако мне не хватило проницательности. :) ЗЫ К Антону Палычу у меня нет претензий.
- Ответить
Спеллеры — зло. Без них количество ошибок в тексте скажет мне об авторе не меньше, чем сам текст. А теперь все равны — школота из Подольска и профессор МГУ. Это плохо. Машина не должна быть умнее человека. Ашманов это тоже когда-нибудь поймет, задушенный кофеваркой. Но будет поздно.
Интервью с Денисом Имшенецким, директором и основателем Nethouse Иранские карты заработали в российских банкоматах, российские карты «Мир» в Иране заработают позже Яндекс.Маркет захватил прессу своей рекламой на фасаде аэропорта Волгограда VK может завязать с «Марусей» — гол престижа Яндексу оказался слишком дорогим РБК купил частоту первой российской FM-радиостанции — питерского «Радио Рокс»
Поясню: 1) Про «офисные программы сами проверяют». Ну да, типа с помощью ОРФО и проверяют. До этой версии МС Офиса-2010 проверка в Ворде и была собственно ОРФО. Микрософт в 1994 — 2007 гг. регулярно, для каждой версии Офиса, лицензировал у Информатика четыре модуля — правописания (красные волнистые линии), переносы, тезаурус (синонимы-антонимы), грамматика и стиль (зелёные волнистые линии). К сожалению (или к счастью) в последний раз при заключении договора на ОРФО с Микрософтом прежние менеджеры Информатика зачем-то продали Микрософту не библиотеку правописания и тезауруса, как обычно, а сами словари. И программисты МС сами написали спеллер и тезаурус над ними. Так что теперь в Офисе — спеллер собственной разработки. И только граммер/стиль от Информатика. На наш взгляд, качество проверки в Офисе-2010 значительно упало, так что для ОРФО это скорее хорошо, это рыночный шанс. Как именно упало — на то есть у нас целый аналитический документ, я подумаю, где его выложить. Например, ОРФО проверяет согласованность частей в словах с дефисом, а спеллер от МС для простоты считает, что любые два слова через дефис — правильно. Для русского языка это очень стрёмное правило, пропускающее кучу частых ошибок. Кстати, последние лингвистические инновации от МС в Офисе 2007 были такие: в словаре не было слов «дурак, дурацкий, стерва, дрянь, негр, голубой» и сотен прочих «оскорбительных» слов. Это политкорректные менеджеры заставили их выбросить из словаря ОРФО. Для Микрософта это обычный ход бюрократического процесса. 2) Неужели продаётся? Мы купили Информатик в мае 2010, сейчас выпустили свежую, пополненную версию ОРФО-2010. ОРФО по отдельности и раньше продавалась — даже при наличии ОРФО в Офисе, а теперь вообще идёт на ура, потому что МС ухудшил качество. В общем, крупные компании, связанные с издательским процессом, знают, что надо брать профессиональный продукт, а не попсу. Кроме того, у иностранных представительств в России есть потребность проверять итальянские/немецкие/испанские тексты вперемешку с русскими, этого вроде в Офисе делать нельзя. 3) Про пополнение словаря во всех формах. В Офисе вы должны щёлкать «добавить в словарь» по всем словоформам неизвестного слова. Например, для слова «трансглюкировать» или «неполиткорректный» придётся добавить форм 10-15. В ОРФО можно его добавить один раз во всех формах, это удобнее и быстрее. 4) Спеллеры в браузерах. Ну, вообще они негодные. Сделаны обычно на коленке. Проверяют с ошибками, пропусками, ложными срабатываниями. С нелепыми подсказками типа «Яндекс — недокись». Ну вот слвоа «Микрософту, лицензировал, попсу» — у меня сейчас Файрфокс подсвечивает, а опечатку «слвоа» — то подсвечивает, то нет. Ну, для бесплатных сгодятся. Вам нравится — используйте. Мы планируем выпустить в ближайшие полгода свой бесплатный пакет для браузеров — с хорошим качеством. 5) Нормальный русский спеллер для Мака. Да, его там нет вообще. Уже лет 20. Это реально прореха в мироздании. Мы сделаем спеллер для виндового Опен Офиса в ближайшие пару месяцев и спеллер для Мака и Линуха в ближайшие полгода. 6) Грамота.ру. Насколько я понимаю, на Грамоте проверяются отдельные слова, по словарям, в исходной форме (как в словаре), но нет проверки текстов или слов в косвенной форме. Есть свой спеллер на Яндексе, он основан на словаре ОРФО, купленном год назад у старых владельцев Информатика, ну и на своих словарях и статистических данных из поиска. На мой взгляд, проверяет пока не очень. Опять же, для интернет-текстов — сойдёт. Короче говоря, ОРФО нужна тем, кому требуется «настоящая» орфография для настоящей работы с ответственными текстами. Кроме того, ОРФО — живой продукт. То есть постоянно пополняется профессионалами, что про другие спеллеры часто можно сказать только с большой натяжкой. Ну и грамматику/стиль(в том числе знаки препинания и согласования падежей, стилистические ошибки типа «подъезжая к городу, слетела шляпа») не проверяет больше никто. Конечно, наследство нам досталось ржавое и скрипящее, которым мало занимались последние лет пять, но мы его уже почистили и смазали, сейчас начнём менять ходовую, кузов и т.п. Сама по себе ОРФО — лимузин среди дешёвых Жигулей, так что зачем её покупать — понятно.