А что интересует индийцев? (Фото Mitchell Kanashkevich / Corbis.) Международная группа исследователей провела первый в своём роде крупномасштабный контент-анализ многоязычных текстов с использованием искусственного интеллекта.
Выяснилось, что европейские СМИ отбирают информационные поводы на основе национальных предубеждений, а также культурных, экономических и географических связей между странами. Конечно, каждый сайт и каждая газета руководствуются индивидуальными критериями, но чёткая тенденция всё равно просматривается.
Исследователи «скормили» системам машинного перевода и текстового анализа 1 370 874 статьи на 22 языках, увидевших свет в 27 странах. Размер выборки, осмелимся заметить, намного превосходит показатели всех прочих традиционных методов.
Специалисты прежде всего составили десятку крупнейших СМИ для каждой страны, исходя из трафика новостной ленты или главной веб-страницы. В выборку вошли основные новости, публиковавшиеся с 1 августа 2009 года по 31 января 2010-го. Неанглоязычных среди них набралось 1,2 млн.
СМИ из стран, которые имеют крепкие торговые связи, находятся в еврозоне и чаще голосуют друг за друга на песенном конкурсе «Евровидение», с большей охотой информируют публику о происходящем у партнёра. Чего не скажешь о государствах, которые не пользуются евро или присоединились к Евросоюзу позже остальных.
Как и ожидалось, наиболее тесными связями обладают Греция и Кипр, Чехия и Словакия, Латвия и Эстония, Великобритания и Ирландия, Бельгия и Франция.
Связи между странами, не имеющими общих границ, а также торговых и культурных интересов, станут предметом последующих исследований.
«Такой подход способен революционизировать наше представление о средствах массовой информации и информационных системах, — считает соавтор исследования Джастин Льюис из Кардиффского университета (Великобритания). — Открывается возможность анализа медиасферы в глобальном масштабе с огромным количеством материала. Кроме того, подход позволяет нам использовать автоматизированные средства для выявления содержательных кластеров и шаблонов и тем самым выходить на новый уровень объективности анализа».
«Автоматизация анализа содержания новостей имеет важное значение, ибо СМИ играют сегодня большую роль в формировании представлений о происходящем в мире», — подчёркивает Нелло Кристианин из Бристолького университета (Великобритания).
Результаты исследования опубликованы в журнале PLoS ONE.
Подготовлено по материалам Кардиффского университета.
|