Навіщо гуманітаріям програмування? Три свіжих дослідження в digital humanities

Зображення:, libguides.usc.edu

В Україні всі масово стають програмістами — кількість фахівців зростає щорічно на 20 %. З огляду на зарплатню, програмування починають вчити навіть менеджери й філологи. І хоча в нас це, мабуть, радше через безвихідь, на Заході кодити гуманітарії починають через потребу й можливість застосувати цифру у своїх дослідженнях. Такий напрям наукових розвідок вже прозвали Digital Humanities (DH) — цифрові гуманітарні науки.

Починаючи з 1980-х був бум оцифрування матеріалів, після чого дослідники перейшли до їхньої обробки та аналізу. Нині активно триває дискусія, що ж цим DH називати, а що ні. Вона так і називається — дебати у Digital Humanities. Тож визначень цього поняття вже є вкрай багато, проте звернімося до Оксфордського словника: «Digital Humanities — це академічна галузь, пов'язана із застосуванням обчислювальних інструментів і методів для традиційних гуманітарних дисциплін, таких як література, історія і філософія». Цим напрямом уже займається багато наукових шкіл у Європі, Канаді та США. Ось, наприклад, у Дартмутському коледжі, одному з найстаріших університетів Сполучених Штатів, кажуть, що напрям Digital Humanities як галузь досліджень, викладання і практики процвітає. Співробітники і студенти факультету DH створюють цифрові ігри, розробляють онлайн-колекції, аналізують соціальні медіа та розбираються з текстовими даними.

«DH — це місце, де обчислення відповідає на велику кількість питань із гуманітарних наук. За своєю природою цей напрям включає нові методи, аналіз та інструменти для відкриття нових способів розуміння світу, що нас оточує. DH є глобальним за масштабами і трансмедійним за замовчуванням», ідеться на сайті університету.

Комп’ютеризація всього

Саме на міждисциплінарності DH часто наголошують дослідники. Про це йдеться й у Маніфесті цифрових гуманітарних наук, який ухвалили в Парижі 2011-го.

Нещодавно український спеціаліст із Natural Language Processing (обробка природної мови, загальний напрямок штучного інтелекту й математичної лінгвістики) Всеволод Дьомкін згадав про тренд переходу в DH. Він окреслив його як «область дослідження і навчання, що ґрунтується на комп’ютеризації всіх сфер життя, у тому числі і гуманітарних, включно з питаннями соціологічними, психологічними, історією, журналістикою і так далі». Щодо журналістики, то, мабуть, найяскравішим застосуванням цифри тут можна назвати журналістику даних, про яку MediaSapiens уже спілкувався з головним редактором Texty.org Романом Кульчинським. У розмові він наголосив на безпосередньому використанні програмування у великих проектах видання. Наприклад, останній проект «Три дні перед весною»:

Принтскрин із проекту

Тому навіть в Україні рух до DH очевидний. Наприклад, київська Нова художня школа обіцяє, що «під час навчання для студентів створюється мультидисциплінарне комунікативне поле, в якому вони мають нагоду спілкуватися з представниками академічної сфери: digital humanities, visual culture stadies, гендерні дослідження...».

Може здаватися, що DH — це продукт 2000-х років, але це не так. Професор Кельнського університету Таллед Манфред виокремив чотири етапи розвитку цієї галузі:

1)                 1949–1970 роки, коли були тільки окремі вкраплення використання комп’ютерів у гуманітарних науках. Тим не менш, це не завадило французькому історику Ле Руа Ладюрі написати в 1968 році відому фразу: «В майбутньому історик стане програмістом або він не буде нічого коштувати»;

2)                 приблизно 1970–1985 роки. Період радикальних змін у зв’язку з появою пакетів прикладних програм (наприклад, офісне програмне забезпечення для роботи з документами). Це період, коли гуманітарії ще не приділяли багато часу вивченню командних мов чи програм;

3)                 орієнтовно 1985–1997 роки. Період, головною характеристикою якого є істотний вплив мікрокомп'ютерної революції. Основною зміною стала можливість виконувати важливу частину професійної роботи гуманітаріїв за своїм робочим столом. Обробка тексту відійшла на другий план, домінувати стала робота з базами даних;

4)    1997 — 2000-ні — інтернет-революція. Комп'ютер стає засобом презентації й доступу до величезного корпусу матеріалів. Дослідникам часто залишається вже не оцифрування, а аналіз, оскільки доступ до великої кількості інформації вже є.

Також, за спостереженнями Таллера, спільноту DH можна розділити на чотири групи:

  • дослідники «тексту як такого»;
  • дослідники — збирачі «фактів» в електронних (іноді дуже великих колекціях);
  • дослідники «нетекстів» (у тому числі віртуальних реконструкцій);
  • дослідники впливу цифрового середовища на гуманітарні науки в цілому.

Наприклад, Аманда Вісконті каже, що написала свого часу вкрай цифрову докторську дисертацію (вона називалась «Як вам може подобатися робота, якщо ви її не знаєте: необхідний код та дизайн для спільних цифрових видань» — "How can you love a work if you don't know it?": critical code and design toward participatory digital editions), у якій не було написано жодного розділу. Замість писанини вона витратила більше часу на роздуми щодо кращих методів і форматів публікації для вивчення її дослідницького питання та обміну тим, що вона дізналася. Як виявилося, проектування, кодування, ведення блогу і тестування користувачами того, що вона створила, було кращими способами для її дослідження.

Вона вчинила так замість зробити одну традиційну дисертацію й цілий додатковий проект DH, який би офіційно, мабуть, і не враховувався. «DH, у яких я працювала, відкриті для переосмислення того, що і яким чином ми оцінюємо, як мають виглядати науковці (scholar), враховуючи сучасні знання та можливості, — пише Аманда. — Цифрові гуманітарні науки не сфокусовані лише на оцифруванні речей. Проекти DH часто не зупиняються на скануванні й розміщенні гуманітарних матеріалів, таких як історичні газети або фотографії в інтернеті (хоча вони можуть зупинитися й поділитися цим). Проекти DH радше роблять як спосіб вивчення чи поліпшення процесу оцифрування або ж як прелюдії до додаткових досліджень. DH частіше фокусуються на розробці надихаючих і корисних способів взаємодії з цими онлайн-матеріалами, як тільки вони стають цифровими».

А можна конкретніше?

Нині прикладів таких робіт багато: від простих до дуже детальних і наукоємних. Мабуть, ви вже чули про те, що професор математики Ендрю Беверидж із коледжу Макалестер і його студентка Джі Шан за допомогою теорії графів «вирахували» головних персонажів серії книг «Гра престолів».

Або ж про те, як текст книжки «Поклик Зозулі» (The Cuckoo’s Calling) проаналізували за допомогою програми JGAAP (Java Graphical Authorship Attibution Program) та викрили авторство Джоан Роулінг. «Чи це дослідження доводило, що Роулінг була насправді автором? Звісно, що ні. Навіть ДНК не зможе цього зробити… Проте цього було достатньо для Sunday Times, щоб звернутися до її агента. 13 липня 2013 року Роулінг підтвердила, що “Поклик Зозулі” справді її робота. Вона сподівалася, що публікація цього твору під псевдонімом допоможе отримати об’єктивніші відгуки», — розповідає дослідниця Патрік Джуола у Scientific America.

Джерело: Hypable.com

Але це все квіточки.

Ягідки DH можуть виглядати як:

Є навіть окремі наукові журнали, що спеціалізуються на DH. Один із них — Digital Humanities Quarterly, що виходить із 2007-го. Нижче описано три дослідження з цього журналу, які були опубліковані наприкінці 2016-го — початку 2017 років.

1. Трагічна соціальна мережа Шекспіра, або Чому весь світ — театр (Shakespeare’s Tragic Social Network; or Why All the World’s a Stage, 2017).

Для свого дослідження Джеймс Лі та Джейсон Лі візуалізували сцени з п’єс Шекспіра, щоби чіткіше проілюструвати соціальні зв’язки між персонажами. Це дозволило науковцям глибше аналізувати творчість класика та поглянути на неї під новим кутом зору. Для візуалізації вони створили діаграми, використовуючи NetworkX (пакет мови програмування Python), що застосовується для вивчення структури, динаміки та функцій складних мереж. Отже, в цих діаграмах є чотири виміри:

1)                 взаємодія між персонажами, що вимірюються по тому, кому спікер наразі відповідає (краї (edges) між «вузлами»);

2)                 частота взаємодії з іншими персонажами (довжина країв між «вузлами»);

3)                 обсяг мови кожного персонажа (радіус «вузла») і щільності мережі (кількість країв, що оточують кожен символ).

Наприклад, так виглядає третя сцена 5-го акту у п’єсі «Ромео та Джельєта».

«Наш мережевий аналіз трагедій додає історичного контексту до розуміння соціальної мережі, показуючи, як Шекспір будує найщільніші соціальні зв’язки саме в моменти руйнування громадського порядку», — пишуть дослідники. Тобто вони намагаються з’ясувати, яким чином у різних конфліктних ситуаціях персонажі, навпаки, більше взаємодіють між собою.

Таке дослідження також допомагає краще зрозуміти, як корелюється текст п’єси з безпосередніми зв’язками акторів на сцені. «Шекспірівська трагедія збиває з пантелику читача і глядача, бо представляє стан хаотичного соціального безладу, що на противагу виникає із зібрання щільно організованої мережі тіл і персонажів на сцені», — кажуть автори.

2. Цифровий сюрреалізм: візуалізація студії анімації Волта Діснея (Digital Surrealism: Visualizing Walt Disney Animation Studios, 2017).

Це просто космічне дослідження від Кевіна Фергюсона з Колледжу Квінс, Міського університету Нью-Йорка. Він у дуже специфічний спосіб дослідив 55 мультфільмів від Діснея, що вийшли в період між 1937 та 2016 роками. Кевін назвав цей метод «цифровим сюрреалізмом».

Основним інструментом науковця є ImageJ — це програма з відкритим вихідним кодом для аналізу й обробки зображень. Тож дослідник розбив анімаційні фільми на послідовність зображень — 0,5 кадрів на секунду, або один кадр щодві секунди.

Потім, використовуючи функції програми «підсумувати z-проекцію», він перетворив архів кадрів на сюрреалістичне панно. «Цей процес візуалізує фільми способами, які не були можливі для людей протягом минулих століть, захоплюючи крайні межі рухомого зображення і згортаючи всі кадри в єдиний простір», — пише Кевін. Зрештою, він отримав дуже специфічні зображення, які дозволяють робити цікаві висновки щодо діснеївських стрічок.

Приміром, можна показати, що автори фільмів розміщували героїв переважно в центрі та затемнювали (віньєтували) краї кадрів.

Підсумована рамка z-проекції стрічки «Аліна в Країні Див»

Окремі кадри стрічки «Аліна в Країні Див», що показують Алісу по центру кадру.

Дослідник також робить багато цікавих висновків щодо розміщення героїв та побудови сцен. А розташовуючи кадри залежно від різних параметрів (відтінок, яскравість), можна дізнатися, зокрема, що z-проекції мультфільмів можуть бути напрочуд схожими. Це не обов'язково пов'язано з тими ж аніматорами або способами виробництва (наприклад, «Меч у камені» (The Sword in the Stone) і «Аладін» (Aladdin) майже ідентичні, проте між їх створенням минуло близько тридцяти років). Тож така візуальна схожість відтінку та яскравості потребують додаткових досліджень, щоб вивчити, наскільки свідомо аніматори Діснея виокремлювали ці стрічки від інших фільмів.

Графік сумарних z-проекцій Діснея, побудований за відтінком [вісь x] та яскравістю [вісь y].

3. Шосте щорічне звернення Обами: зображення, доступність, потік (Obama’s Sixth Annual Address: Image, Affordance, Flow, 2016).

Дан Фальтешек із Державного університету штату Орегон (США) детально дослідив звернення «Про становище країни» Барака Обами у 2016-му. Проте він знову ж таки, як і попередні науковці, зробив це у своєрідний спосіб: розібравши візуальне супроводження доповіді у слайдах та у «водоспаді» Twitter.

Слайди до промови Барака Обами.

Twitter-трансляція промови

Дан виявив, що команда президента вкрай обережно використовувала червоний колір. Тобто це було зроблено для привернення уваги, зокрема до проблем навколишнього середовища. Крім того, він простежив, як у доповіді використовувалися хештеги, гіфки, онлайн-опитування. Перші для дослідження було навіть зібрано у графік.

Хештеги у слайдах

Опитування використовувалися у twitter-трансляції для активізації аудиторії, а гіфки з американським прапором та салютом (на противагу їхньому звичному іронічному застосуванню) було використано наприкінці для створення атмосфери завершення. Це дослідження може бути цікавішим для журналістів, ніж попередні, тому що дозволяє краще зрозуміти використання політиками нових медіа.

***

Отже, якщо вас раптом не надихнули вищенаведені розвідки — я сподіваюся, що надихнули, але все ж — роботи з DH є хорошою нагодою замислитися про використання комп’ютерних технологій у вашій галузі. Це допомагає поглянути на предмет дослідження під новими, вкрай нестандартними кутами.

comments powered by Disqus