Головна Техно

Як українським медіа не програти боротьбу з ШІ

Штучний інтелект може допомогти українським медіа заробляти, якщо цю нагоду не проґавити, – впевнений Іван Верстюк, ДМ

Здається, нас хочуть надути. Саме така ідея спала на думку керівникам газети New York Times, коли вони зрозуміли, що штучний інтелект від компанії OpenAI без дозволу користується онлайн-архівами видання, плануючи заробляти на цьому гроші.

От-от мав статися грандіозний медійний скандал із цього приводу, але OpenAI швидко виправилася й змінила поведінку. Тепер вона пропонує інтернет-виданням гроші за те, щоб користуватися їхнім контентом, аби відображати релевантні результати у вебпошуку, базованому на штучному інтелекті.

Нещодавно стало відомо, що видавець газети Wall Street Journal і деяких інших видань — компанія News Corp — домовилася з OpenAI про продаж їй доступу до своїх архівів із метою використання їх у вебпошуку за $250 млн у межах п’ятирічної домовленості. Схожі, але менш дорогі угоди підписали Financial Times, Axel Springer, AP.

Що ж робити українським медіа за таких умов? Ймовірність того, що онлайн-архіви українських інтернет-сайтів будуть використані для побудови нових алгоритмів вебпошуку з використанням ШІ безплатно, зараз не дуже висока. Це там, десь в Америці чи Західній Європі, великі технологічні компанії сплачують медіа за використання контенту, а в Україні вони ж не зобов’язані це робити. Дикий капіталізм і все таке.

Почнемо з фактів. Зараз триває революція пошукових систем, де досить суворо змагаються за клієнтів і клієнток такі компанії, як Microsoft (вона співпрацює з OpenAI), Google, Apple. Цю революцію спричинив ШІ, який від звичного нам пошуку відрізняється тим, що видає не посилання у відповідь на наш запит, а готову відповідь — переважно у вигляді тексту. Цей текст він формує самотужки, переважно завдяки даним з інформаційних сайтів, із медіа. Мабуть, у майбутньому він також зможе брати дані з книжок, але тут треба буде домовлятися з Amazon — і це точно не буде дешево. Або компанія Google оживить свій проєкт Google Books з метою заробітку в добу ШІ.

Пошукові системи, як правило, локалізуються під певну країну та її мовне середовище. Інколи це дуже поверхнева локалізація, інколи дуже продумана та якісна. В Україні ми звикли до того, що пошук Google не був аж так добре локалізований, але він розумів, що таке Україна.

Тепер — інакша ера. Пошукові системи намагатимуться локалізуватися в Україні значно краще, а тому їм потрібне опертя на дані з українських медіа та на їхні архіви. В принципі, ніщо не заважає українському виданню так само виставити ціну за використання своїх архівів для вебпошуку на основі ШІ, як це зробили американські та європейські колеги.

Втім, структура українського медіаринку не показує жодного видання, чиї архіви були би достатніми для повноцінного вебпошуку. В Україні такий пошук може бути реалізований лише якщо користуватися архівом десятка онлайн-видань. Можна було би чекати, що кожне з них вступить у переговори, скажімо, з Microsoft або Google і досягне потрібної угоди. Та дуже важко оцінити реалістичність досягнення цього.

Було би набагато краще, якби українські медіа зуміли домовитися про «пакетну угоду» з вебпошуковиками, об’єднавшись для цього у пул. Простіше кажучи, десять найбільших інформаційних сайтів України створюють окрему юрособу, котрою володіють спільно. Та продають пошуковій системі право користуватися архівами цих сайтів, а отримані кошти розподіляють відповідно до домовленостей засновників цієї юрособи.

Чи здатні українські медіа домовитися між собою про щось подібне? Складне питання. Відповім так: якби захотіли, то змогли б. Бо інакше — грошей не заробить ніхто, а архіви будуть використовуватися в пошукових результатах на основі ШІ без чийогось дозволу.

І є ще кілька речей, про які варто поговорити. Багато українських інтернет-сайтів уже понад десять років використовують технологію SEO-оптимізації, намагаючись здобути якомога вище місце в пошукових результатах, переважно в межах екосистеми Google. ШІ зараз активно руйнує цю технологію. Вона може мати якесь майбутнє, якщо той самий Google вирішить, що SEO є для них вигідним, однак є висока ймовірність, що ця технологія зникне. Точно можна сказати, що інвестувати в неї не варто, хоча українські медіа звикли це робити.

Важливим є те, що вебпошук на основі штучного інтелекту переважно працює не з самою реальністю, а з тим, як ця реальність відображається в медіа. Поясню. Якщо ви поцікавитеся у такого пошуку про те, який мобільний тариф вам краще обрати (або це може бути не мобільний тариф, а ціни на відпочинок чи передплата в онлайн-кінотеатрі), то пошук на основі ШІ сформулює свою відповідь, звернувшись до того, що пишуть про тарифи насамперед медіа, а не офіційні інтернет-сайти мобільних операторів.

Це створить спокусу для українських медіа накачувати свої сайти різноманітною інформацією, що не потрібна споживачеві новин, але потрібна для вебпошуку. Фахівці з інтернет-комерції добре знають про таку технологію, як публікації гороскопів чи описів фармацевтичних препаратів із метою накручування трафіку. Це більше схоже не на журналістику, а на «криптомайнінг».

Цей виклик залишається в нашому медійному середовищі. А враховуючи рішуче бажання певної категорії медіаменеджерів заробляти гроші з повітря — ця дивна індустрія взаємодії з пошуковими системами житиме. І комусь доведеться в ній працювати, публікуючи на певному сайті які завгодно енциклопедичні дані, аби лиш вебпошук до них звертався, сплачуючи за такий доступ. Головним ризиком є те, що може початися нова доба крадіжок інформації, даних, контенту — оскільки не зовсім зрозуміло, хто й кого та за яким законодавством буде карати за подібні порушення.

З хорошого, в українській медійній індустрії має сформулюватися попит на такий вид матеріалів, як колонка з авторськими порадами. Штучний інтелект саме і звертається до таких матеріалів, як ми це бачимо в США та Європі, щоб сформулювати пошукові відповіді. Тому гарні технологічні, бізнесові, медичні, кулінарні колумністи отримають чимало нової, цікавої роботи. Якщо ж українці та українки заведуть моду питатися в ШІ, хто стане наступним президентом України, то ШІ сміливо взаємодіятиме з політичними колонками та статтями, а також соціологічною інформацією (в її відображенні в медіа) — і це теж доволі цікаво. При пошуку відповідей на історичні питання ШІ навряд чи довірятиме Вікіпедії, так само обираючи за більш пріоритетне джерело медіа. Тому виросте й ціна авторів/авторок, що пишуть на історичні теми, але виростуть вимоги до фактчекінгу таких матеріалів і їхньої джерельної бази.

Потенційно могла би піти «попереду всієї планети» бібліотека імені Вернадського, продавши пошуковикам на основі ШІ доступ до своїх ресурсів, які, звісно, потрібно попередньо відцифрувати. Але — пам’ятаймо і про нашу стратегічну безпеку. Бібліотеки такого рівня мають свою політику спецфондів, котрі навіть не те що суворо обмежують, а регулюють доступ до певних видань.

Підсумовуючи ці міркування, хотів би сказати ще пару речей. Індустрія ШІ достатньо серйозно споживає електрику. Щойно країна починає використовувати ШІ на повну потужність — це вимагає додаткових енергоресурсів, а з ними в Україні нині дефіцит. Тому з технічних причин Україні буде досить важко пережити ШІ-революцію.

Залишається достатньо високим ризик узагалі проспати всі події з ШІ та ще багато років жити по-старому. Насправді це буде ілюзією. Пасивність медіа у реагуванні на нові технологічні виклики просто стане причиною для того, що доходи від вебпошуку на основі ШІ залишаться цілковито на стороні пошукових систем, а не медійних компаній та організацій.

А ще варто не забувати про креатив і додану вартість, яку ми таки можемо створити з цього питання в Україні. Якщо ми винайдемо нові способи взаємодії медійної екосистеми зі штучним інтелектом, ще й, бажано, врегулювавши це законодавчо та/або юридично, то це зміцнить наші медіа, зміцнить нашу інформаційну безпеку. Точно можна сказати, що ШІ може стати фільтром, котрий не допускатиме до українського інтернету російську пропаганду. Але можна придумати й інші ролі для цієї технології.

Тож помічаймо реальність і реагуймо на неї.

Ілюстрація: Getty Images