hemiechinus (hemiechinus) wrote,
hemiechinus
hemiechinus

Categories:

Lsjbot - программа-бот, "перу" которой принадлежит 2.7 миллиона статей Википедии

tech-terror-maria
Люди, которые интенсивно пользуются интернет-энциклопедией Wikipedia, наверняка стали замечать, что в ней стало появляться все больше и больше материала, наполненного цифрами и фактами, и написанного "сухим", иногда даже кажущимся неестественным языком. Это является прямым следствием того, что подавляющее большинство новых материалов для Википедии уже создается не людьми-энтузиастами, авторами этого материала являются специализированные программы-боты, которые в автоматическом режиме собирают данные из множества достоверных источников, обрабатывают эти "сырые" данные и производят удобочитаемый текст статьи на основе одного из стандартизованных шаблонов.

Согласно информации, опубликованной недавно издательством Wall Street Journal, самой продуктивной программой-ботом является программа Lsjbot, которая добавляет в Википедию около 10 тысяч статей в день, а всего ее "перу" принадлежит около 2.7 миллиона уже размещенных статей, что составляет 8.5 процентов от общего количества. Программа Lsjbot является детищем Сверкера Йоханссона (Sverker Johansson), сотрудника Шведского университета, которые имеет ученые степени в области лингвистики, гражданского строительства, экономики и физики элементарных частиц.
Большинство статей, генерируемых программой Lsjbot, касается видов животных и описаний небольших городов на Филлипинах. Две трети статей написаны на языке филлипино и одна треть - на шведском языке. Как только программе указывают объекты для написания статей, к сожалению, она пока не может искать их самостоятельно, программа собирает из разных уголков Интернета всю доступную информацию, пишет статью и отправляет ее на Википедию.
Википедия принимает статьи от нескольких видов программ-ботов, к примеру от программы rambot, которая используется для сбора данных и написания статей об американских городах, округах и штатах. Но создание Сверкера Йоханссона является безусловным лидером, как по качеству, так и по количеству посылаемого в Википедию материала.
У практики использования автоматизированных программ-ботов для наполнения Википедии имеется масса противников. Но Йоханссон яро защищает такой подход, аргументируя это тем, что достаточно большое количество материала в Википедии написано "малолетними кретинами". В качестве примера он приводит, что в шведском сегменте Википедии присутствует 150 статей, касающихся темы "Властелина колец", а тематике войны во Вьетнаме посвящено всего 10 статей, да и те не блещут информативностью. В статьях же, сформированных программой Lsjbot, предоставлена только достоверная информация, взятая из надежных источников, эти статьи точны, за крайне редкими исключениями, и с помощью программ-ботов можно осветить в Википедии те темы, до которых у живых людей никогда не дошли бы руки.
http://tehnowar.ru/10202-lsjbot-programma-bot-peru-kotoroy-prinadlezhit-27-milliona-statey-vikipedii.html
СКОРО И САМУ ВИКИПЕДИЮ БУДУТ ПРЕИМУЩЕСТВЕННО ИИ ЧИТАТЬ.
Tags: "Искусственный Интеллект", Информатика
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments