ЦЯ АНІМОВАНА МОНА-ЛІЗА БУЛА СТВОРЕНА AI, І ЦЕ ЖАХЛИВО

Send

Загадкова, розмальована посмішка "Мона Лізи" відома у всьому світі, але це відоме обличчя нещодавно показало приголомшливий новий діапазон виразів, ввічливість штучного інтелекту (AI).

У відео, яке поділилося на YouTube 21 травня, три відеокліпи демонструють непомітні приклади Мона Лізи, коли вона рухає губами та повертає голову. Вона була створена конволюційною нейронною мережею - типом ШІ, який обробляє інформацію так само, як це робить людський мозок, для аналізу та обробки зображень.

Дослідники навчили алгоритм зрозуміти загальні форми рис обличчя та їх поведінку відносно один одного, а потім застосувати цю інформацію до нерухомих зображень. Результатом стала реалістична відео послідовність нових мімік з одного кадру.

Для відео Mona Lisa AI "навчився" руху обличчя з наборів даних трьох людських предметів, створюючи три дуже різні анімації. Незважаючи на те, що кожен із трьох кліпів все ще був розпізнаваний як Mona Lisa, зміни в зовнішності та поведінці тренінгових моделей надавали "особистість" "живим портретам", Єгор Захаров, інженер з Інституту науки і техніки ім. Сколково, і Центр AI Samsung (обидва розташовані в Москві), пояснено у відео.

Захаров та його колеги також створили анімацію з фотографій культурних ікон 20 століття, таких як Альберт Ейнштейн, Мерилін Монро та Сальвадор Далі. У дослідженні, опублікованому в Інтернеті 20 травня в журналі передрукових друкованих видань arXiv, дослідники описали свої результати, які не були рецензовані.

Знайомі обличчя приймають незнайомі вирази. (Імідж кредиту: Е. Захаров та ін.)

Зробити оригінальні відеоролики на кшталт цього, відомі як deepfakes, непросто. Людські голови геометрично складні та дуже динамічні; 3D-моделі головок мають "десятки мільйонів параметрів", - написали автори дослідження.

Крім того, система зору людини дуже добре виявляє "навіть незначні помилки" в 3D-модельованих людських головах, згідно з дослідженням. Бачити щось, що виглядає майже по-людськи - але не зовсім - викликає відчуття глибокої тривоги, відомої як ефект нечистої долини.

Раніше AI продемонстрував, що можливе створення переконливих глубоких фейків, але для цього потрібні кілька кутів потрібної теми. Для нового дослідження інженери представили ШІ дуже великий набір довідкових відеороликів, що показують людські обличчя в дії. Вчені встановили орієнтири обличчя, які стосуватимуться будь-якого обличчя, щоб навчити нейронну мережу поведінки облич взагалі.

Потім вони навчили AI використовувати опорні вирази для відображення руху особливостей джерела. Це дало змогу ШІ створити глибоку підробку навіть тоді, коли у неї було лише одне зображення, над яким можна було працювати, повідомляють дослідники.

А більше вихідних зображень дало ще більш детальний результат у фінальній анімації. Відео, створені з 32 зображень, а не з одного, досягли "ідеального реалізму" в дослідженні користувачів, пише вчені.

Send