• Актуальнае
  • Медыяправа
  • Карыснае
  • Кірункі і кампаніі
  • Агляды і маніторынгі
  • Рэкамендацыі па бяспецы калег

    ChatGPT как инструмент для быстрого поиска: Советы журналистам-расследователям

    С появлением новых инструментов генеративного ИИ журналисты-расследователи наблюдают, как много появляется этических проблем и возможных ошибок в противовес новым возможностям ИИ. Это вызывает путаницу.

    Изображение: Shut­ter­stock

    Первоначально этот материал был опубликован Глобальной сетью журналистов-расследователей и перепечатывается здесь с ее разрешения. Произведение защищено лицензией Международная лицензия Cre­ative Com­mons Attri­bu­tion-NoDeriv­a­tives 4.0.

    Первые примеры использования ИИ в журналистике касались самых разных задач – от программирования до составления информационных справок или создания графиков. Каждую неделю появляются новые бесплатные или платные инструменты ИИ, которые можно применить в журналистике. С другой стороны, есть много примеров, когда инструменты генеративного ИИ выдавали не самые надёжные доказательства или подтверждения, поскольку подвержены предубеждениям и систематическим ошибкам. (Подробнее об этических аспектах и расширенных возможностях применения этих платформ читайте в недавнем материале GIJN «Новые инструменты на основе ИИ и больших языковых моделей для журналистов: Что нужно знать»).

    В рамках Конференции журналистов и редакторов-расследователей 2024 года на одном из семинаров репортёрам посоветовали, как избежать многих опасностей и путаницы, не чураясь освоения этой новой технологии – просто используя ИИ-чатбот Chat­G­PT в качестве более узконаправленного инструмента поиска.

    Джереми Джоджола – репортёр-расследователь телеканала KUSA-TV в Денвере, штат Колорадо, получивший в 2020 году медаль Дона Боллеса от IRE за репортажи об экстремистских группах, выступающих за превосходство белой расы, говорит, что поиск контактов и быстрый анализ документов с помощью этой модели может не только сэкономить время в начале расследования, но и помочь наладить общение с важными источниками, о которых иначе вы могли бы не знать.

    По его словам, главное – использовать такие большие языковые модели (БЯМ или LLM – от англ. Large lan­guage mod­el – прим. ред.), как Chat­G­PT, только в начале расследовательського проекта и лишь для того, чтобы помочь сориентироваться вам, журналисту, – а не для информирования аудитории.

    «Это не источник, на который можно ссылаться, а лишь отправная точка. По нашим этическим и юридическим стандартам очень важно, чтобы ничего из выдачи ИИ не попадало в наши материалы», – предупредил Джоджола. «Я никогда не использую ответы Chat­G­PT для контента – ни для текстов, ни для написания сценария. Все сокровища в ваших материалах вы добываете репортажной работой. А программа может лишь предоставить вам карту, которая укажет направление к этим сокровищам. Это потрясающий инструмент, даже если вы его используете просто как расширенный поиск Google».

    ChatGPT + Поиск Google = быстрее и результативнее

    Chat­G­PT как большая языковая модель в своих ответах в основном опирается на огромные массивы обучающих данных, а не на индексацию веб-страниц, поэтому поисковые системы, такие как Google, по-прежнему остаются более точными, полными и актуальными для общих запросов – особенно при использовании поисковых операторов.

    Но некоторые журналисты, например Джоджола, утверждают, что перебирать результаты выдачи Google, где будут доминировать сайты с накрученным SEO-оптимизацией рейтингом, может быть настолько сложно, что это отбивает у коллег желание искать новые источники или выявлять тенденции, и что им не хватает функций быстрого анализа документов.

    Поэтому он использует Chat­G­PT – и особенно платную версию GPT‑4, которая также может искать информацию в интернете, – чтобы быстро находить контакты, зацепки и новые темы. Бесплатная версия GPT 3.5 от Ope­nAI не подключена напрямую к интернету, а обучена давать текстовые ответы на основе «огромного количества написанных людьми в интернете текстов, в том числе разговоров», что помогает объяснить как её ошибки, так и её человекоподобный диалог. Её данные не актуальны. Модель GPT‑4 (стоит 20 долларов в месяц), которая также может принимать в качестве подсказок изображения и скриншоты, обучена на гораздо большем количестве гигабайт данных, а также имеет доступ в интернет и, следовательно, содержит актуальную информацию.

    Несмотря на ошибки, Джоджола считает, что различные чат-боты от Ope­nAI полезны для упорядочивания данных, и что их быстрый формат ответов на поисковые запросы и лаконичные резюме может привести к увеличению, а не уменьшению числа контактов репортёров с новыми источниками.

    В качестве примера для семинара он ввёл в чат GPT‑4 следующее: «Я репортёр. Мне нужно найти авторитетного эксперта, который мог бы рассказать о реинтродукции волков в Колорадо. Дай мне список из нескольких имен, организаций, с которыми они связаны, и их контакты». Помимо официальных лиц в государственных органах и некоммерческих организациях, инструмент нашёл в интернете контакты отставного биолога, занимавшего министерские должности и руководившего попытками восстановления популяции волков в Скалистых горах, а также основателя «Лаборатории сосуществования хищников».

    «Как можно сразу не позвонить таким интересным людям?» – сказал Джоджола, усмехаясь. «На самом деле реинтродукция волков – это большая история в Колорадо про конфликт между городскими и сельскими местностями. Если у вас один день на материал, Chat­G­PT за пять секунд предоставит вам список нужных экспертов и их номера телефонов, а поиск в Google занял бы минут 40».

    Он отметил, что преимущества платной версии GPT‑4 заключаются в большем количестве загружаемых документов, более актуальных данных и контекстных «дискуссиях» – когда интерфейс чата даёт ответы в контексте предыдущих вопросов, – но бесплатная версия остаётся эффективной для многих быстрых поисков.

    Поскольку его цель – экономия времени и быстрая фильтрация, Джоджола не тратит время на точную формулировку запросов. Вместо этого он концентрируется на том, что, где и когда нужно искать, и просто формулирует запросы «так, как я бы разговаривал с человеком, только более властно».

    Несколько практических примеров использования ChatGPT для быстрого поиска

    • Быстрый поиск незаметных публичных документов. Помимо тех немногих документов, которые замечают и присылают источники, обращая на них внимание, журналисты получают постоянный поток отчётов, аудиторских проверок и копий государственных контрактов, которые могут содержать или не содержать доказательства неэффективности, системных ошибок, коррупции или злоупотреблений. Джоджола рекомендует загружать объёмные документы в Chat­G­PT вместе с простым запросом, например: «Дай мне краткую информацию об этом государственном контракте и о том, сколько организация получит за услуги. Укажи имена людей в этом контракте и номера страниц, где они фигурируют». (Пример, который он использовал, – госконтракт на систему считывания номерных знаков – в течение нескольких секунд чат выдал корректные суммы госрасходов, условия закупки и несколько имён с номерами страниц). При этом журналистам советуют не загружать конфиденциальные или частные документы. Существуют и более сложные инструменты для разбора документов, в том числе с оптическим распознаванием текста – например, Google Pin­point, – но Джоджола считает, что Chat­G­PT обеспечивает полезный и быстрый начальный фильтр.
    • Резюмирование общественных проблем. Годовые отчёты или стенограммы публичных слушаний по проектам нормативных актов, посвящённых общественным проблемам, часто содержат десятки страниц мелким шрифтом, которые мало у кого из журналистов есть время прочитать. На семинаре Джоджола загрузил 40-страничный годовой отчёт и попросил Chat­G­PT только перечислить и обобщить поднятые проблемы. «Удивительно, как быстро программа может его обработать», – заметил он. Повторюсь: инструмент может упустить нюансы и допустить ошибки, но он даёт почти мгновенное описание характера и объёма проблем, поднятых на общественных слушаниях, что может послужить толчком к более глубокому изучению и созданию потенциально интересного материала.
    • Быстрый поиск контактов для описания общей картины. По мнению Джоджолы, Chat­G­PT может побудить репортёров начать обзванивать новые источники, просто выдав за несколько секунд полдюжины имён, должностей и номеров телефонов экспертов на одной странице. Затем можно выбрать, к кому обратиться за описанием в общих чертах – возможно, к учёному – и задать эксперту интересующий вопрос, без необходимости листать разные сайты и ходить по десяткам ссылок. Например: на простой запрос «Дай мне контактные данные, включая номера телефонов, организаций, которые помогают жертвам домашнего насилия в Южной Африке» Chat­G­PT выдаёт гораздо более чёткий, одностраничный список контактов, чем поиск в Google по ключевой фразе «поддержка в случаях домашнего насилия ‘Южная Африка’ контакты site:za», который предлагает много страниц местных и международных сайтов. При использовании больших языковых моделей первоначальный список источников для «первого звонка» становится очевидным. (Инструмент искусственного интеллекта также включил в список контакты, связанные с «гендерным насилием», которое в Южной Африке имеет другую направленность и может быть более релевантным для данной истории).
    • Упорядочивание официальных контактов. Джоджола продемонстрировал, как Chat­G­PT автоматически находит и упорядочивает по алфавиту большие наборы публичных контактных данных за считанные мгновения, по такому запросу: «Дай мне номера телефонов и адреса электронной почты членов законодательного собрания штата Колорадо, а точнее демократов из Палаты представителей». «Это значительно упрощает сбор данных и получение электронной почты, вместо того чтобы заходить на страничку каждого депутата», – пояснил он.
    • Простой пересказ технических данных – например, отчётов о вскрытии. Во многих небольших новостных редакциях ситуация такова, что если источник не подскажет вам, где искать, то можно легко пропустить тревожные сигналы в технических документах, поскольку часто не хватает времени на их анализ или нет коллег-специалистов, у которых можно спросить. По словам Джоджолы, отчёты судмедэкспертов – хороший пример того, как загрузив их в инструмент с искусственным интеллектом можно быстро найти новые пути для расследования. Конечно, объяснения Chat­G­PT по поводу медицинского заключения затем нужно перепроверить у конкретных судмедэкспертов. «Многие из новостных журналистов не очень понимают отчёты о вскрытии – там много медицинских терминов и многобуквенные названия химических веществ», – отметил он. Затем Джоджола рассказал, как запрос по реальному отчёту о вскрытии жертвы полицейской стрельбы раскрыл неизвестные подробности дела: «Дай мне краткий обзор этого отчёта о вскрытии. Расскажи простым языком, какие вещества были в организме покойного».
    • Быстрое и корректное сравнение. Иногда журналистам трудно сразу понять, является ли цифра, которую они видят в пресс-релизе или годовом отчёте, необычно высокой или низкой, и стоит ли она внимания. Помимо сравнений с другими периодами, инструменты искусственного интеллекта могут сразу же предоставить вам географические ориентиры для сравнительного исследования. Достаточно простого запроса вроде «Назови мне города в Африке, население которых схоже с населением Кигали в Руанде». (Chat­G­PT сразу же ответил, что население Блантайра, Малави, Фритауна, Сьерра-Леоне, и Момбасы тоже составляет 1,2 миллиона человек). «Городские журналисты любят сравнивать свои населённые пункты с другими по таким критериям как преступность, рост населения, транспортные проблемы», – говорит Джоджола. «Опять же, эти цифры из ИИ не будут опубликованы [в материалах], пока я их трижды не перепроверю, но теперь я сразу могу понять, что не так».

    Тем не менее Джоджола признаёт, что иногда его поиски в Chat­G­PT заводят не туда. «На днях я запросил научное исследование о вспышках гнева у водителей, и модель выдала, казалось бы, замечательное исследование, а когда я попросил источник, она меня направила в юридическую фирму, занимающуюся тяжбами о нанесении вреда здоровью, что не очень хорошо», – вспоминает он.

    Но поскольку это был единственный гуглоподобный поиск, который нужно было перепроверить, такие ошибки, по его словам, не играют особой роли. «Всё же она мне показала исследование о вспышках гнева у водителей, проведённое Национальным институтом здравоохранения, более надёжным источником, поэтому я начал с него», – отметил он.

    «Не стоит бояться технологий, они уже здесь», – заключил он. «Просто нужно придерживаться своих стандартов и своего процесса. Ссылайтесь на корректные надёжные источники. Вы же не станете цитировать поиск Google – точно так же и с Chat­G­PT».

    Этот перевод выполнен профессиональным переводчиком A.Talker и отредактирован редакторами GIJN.

    Самыя важныя навіны і матэрыялы ў нашым Тэлеграм-канале — падпісвайцеся!
    @bajmedia
    Найбольш чытанае
    Кожны чацвер мы дасылаем на электронную пошту магчымасці (гранты, вакансіі, конкурсы, стыпендыі), анонсы мерапрыемстваў (лекцыі, дыскусіі, прэзентацыі), а таксама самыя важныя навіны і тэндэнцыі ў свеце медыя.
    Падпісваючыся на рассылку, вы згаджаецеся з Палітыкай канфідэнцыйнасці