December 7, 2015
Digital humanities - stručné vymezení

Pokusil jsem se o stručné vymezení toho, co jsou vlastně Digital Humanities z mého pohledu. Hlavní důvodem je moje neustálá debata o tomto pojmu na akademické půdě. Berte, prosím, tenhle text jako podklad k debatě o Digital Humanities, která se bude dále vést.

Digital humanities přichází jako reakce humanitních a sociálních věd na rozvoj výpočetní techniky a nových (digitálních) médií od poloviny minulého století. S nástupem počítačů se postupně objevují projekty využívající jejich výpočetní sílu a možnosti zpracovávat množství informací, kterou jsou jinak prakticky neuchopitelné jednotlivcem.

Za jednoho z prvních průkopníků v této oblasti se považuje jezuita Roberto Busa, který přišel již v roce 1949 s projektem kompletního zpracování index verborum díla Tomáše Akvinského. Projekt samotný byl nakonec realizován v letech 1974 – 1980 v tištěné verzi 56 svazků za podpory společnosti IBM. Při projektu bylo kompletně dílo Tomáše Akvinského přepsáno do děrných štítků, z nich byla poté vytvořena počítačem úplná konkordance. Dnes je celý Index Thomisticus přístupný na webu.[1] Díky tomu je možné během zlomků sekund vyhledat všechny výskyty daného slova v objemném díle.

Tento průkopnický projekt dobře ukazuje základy přístupu v digital humanities. Byl umožněn výpočetní sílou a novými médii, mění samotný přístup k výzkumu a konečně zaměňuje i celkový přístup k informacím, z nichž výzkum vychází. Tyto změny jsou právě tím, co vymezuje prostor digital humanities.

Komputační obrat

Postupný nástup počítačů v druhé polovině 20. století a zejména jejich neustále klesající cena přinášejí zásadní změnu mj. i ve vědecké práci. Při původním využívání výpočetní síly ve vědě se výzkumník potýkal s relativně drahým sběrem dat ve větším množství a s jejich poměrně drahým zpracováním. Proto byl velký důraz kladen především na formulaci hypotézy a její potvrzování (případně falzifikaci). Od 80. let se však situace mění, díky výkonnému softwaru se postupně dostává do popředí tzv. explorační analýza dat, při níž může výzkumník procházet velké množství dat za účelem nalezení většího počtu hypotéz, které stojí za to dále testovat. K technikám explorační datové analýzy tak patří kupříkladu multidimensional scaling, PCA, ale také běžné vizualizace jako je box-plot či scatter-plot.

Původně čistě statistický přístup je pak doplněn o metody tzv. data miningu, tedy přístupu, který se snaží o získávání netriviálních informací z analýzy dat a který vychází především z tradic počítačové vědy. Mezi základní data-miningové techniky tak patří kupříkladu rozhodovací stromy, asociační pravidla, neuronové sítě, regresní analýza či shluková analýza. Náleží sem ovšem i nejrůznější formy sumarizace včetně vizualizací.[2]

Nová média

Komputační obrat přichází plynule s nástupem nových médií, jak je vymezuje Lev Manovich. Ve své knize The Language of New Media z roku 2001 charakterizuje novomediální svět pomocí pěti základních atributů.[3]

1. Číselná reprezentace
Každé „Novomediální dílo může být vymezeno formálně, matematicky. Například obraz nebo tvar lze popsat matematickou funkcí,“ z čehož vyplývá, že „Novomediální dílo je předmětem algoritmické manipulace. Uplatněním vhodného algoritmu můžeme například automaticky odstranit zrnitost z fotografie, vylepšit její kontrast, rozpoznat tvary nebo změnit proporce. Řečeno ve zkratce, média se stávají programovatelnými.“ Jaký je přímý dopad? Kupříkladu ten, že mobilní aplikace, které nabízejí různé úpravy fotografií pomoci filtrů, jako jsou Hipstamatic nebo Instagram, de facto transformují estetiku starých fotoaparátů do matematických vzorců.

2. Modularita
Manovich popisuje modularitu takto: „Jednotlivé prvky médií, obrazy, zvuky, tvary i jednání jsou reprezentovány jako soubory diskrétních vzorků, ať již jde o pixely, mnohoúhelníky, voxely, znaky, skripty. Na vyšší úrovni jsou tyto jednotky skládány do objektů, ale ponechávají si svojí oddělenou identitu.“ Právě tato modularita, daná předchozí možností číselné reprezentace umožňuje kupříkladu existenci webových stránek, které se skládají z oddělených vrstev. Stejně tak je modularita základem pro další vlastnosti novomediálního díla.

3. Automatizace
Automatizace jako další z atributů novomediálního díla vychází z číselného kódování a modulární struktury, které „[…] umožňují automatizovat řadu operací při vytváření, manipulaci a přístupu k novým médiím. Lidská intencionalita proto může být z tvůrčího procesu alespoň částečně odstraněna.“ Nejvíce viditelným je pro běžného účastníka mediálního světa efekt prohledávatelnosti obsahu, který nejlépe reprezentuje vyhledávač Google.

4. Variabilita
Variabilita novomediálních artefaktů vychází z předchozích bodů. Novomediální dílo lze totiž verzovat a modifikovat či dokonce přizpůsobovat individualitě konzumenta. „Stará média zahrnovala lidského tvůrce, který osobně sestavoval prvky textů, obrazů nebo zvuků do určité kompozice, nebo sekvence. Tím, že byly uloženy do materiálu, je jejich souslednost pevně daná. Může být vytvořeno mnoho kopií původního originálu, které budou v souladu s logikou industriální společnosti zcela identické. Nová média jsou naopak charakteristická svou variabilitou. (Jiná označení tohoto principu nových médií jsou proměnlivost, nebo tekutost.) Namísto identických kopií novomediální objekt dává vzniknout mnoha různým verzím. Spíše než, že by je vytvářel lidský autor, jsou automaticky sestavovány počítačem.“

5. Překódování
Překódování je přirozeným důsledkem interakce kultury a digitálního světa. Platí zde totiž, že „Logika počítačů se vepisuje hluboko do kulturní úrovně médií již z toho důvodu, že nová média jsou vytvářena, rozšiřována, ukládána i archivována díky počítači. Způsoby, kterými počítače formují náš svět, reprezentují a zpřístupňují data, klíčové operace ovládají počítačové programy (vyhledávání, třídění, filtrování), rozhraní člověk-počítač (HCI), zkrátka vše, co můžeme označit za ontologii, epistemologii a pragmatiku počítače, to vše ovlivňuje kulturní úroveň nových médií, jejich organizaci, nové žánry, ale také obsah.“

Digital humanities

Zatímco počítače představují motor nového, digitálního světa, tak digitalizovaná data jsou jeho pohon. V procesu postupné digitalizace lidského světa a jeho historie se otevírají zcela nové možnosti pro výzkum jak v oblasti humanitních, tak sociálních věd.

Můžeme sledovat kupříkladu ambiciózní projekt využívající poměrně komplikovaných postupů (jakým jsou kupříkladu aplikace algoritmu Latent Dirichlet Allocation) na modelování témat v rámci korpusu anglicky psané literatury 19. století jako ve studii Significant themes in 19th-century literature od Matthew L. Jockerse a Davida Mimno..[4] Autoři používají techniku modelování témat pro analýzu více než 3400 děl americké, anglické a irské literatury.

Jiné projekty se snaží využít možností, které nabízí vizualizace velkých obrazových korpusů podle definovaných vlastností. Můžeme tak třeba sledovat dynamiku vývoje světlosti obrazů moderny či zkoumat obrazy Mondriana s ohledem na jejich barevnost, jak to ukazují práce Lva Manoviche v softwaru ImagePlot.[5]

image

Vidíme tedy, že existují způsoby výzkumu, jejichž využití v řadě oblastí humanitních a sociálních věd bylo umožněno až novými médii, respektive fenomény s nimi spojenými – zejména nástupem počítačů. Pro tyto nové způsoby výzkumu, které jsou ovšem často spojeny i se zcela novými druhy výsledků bádání, se vžilo označení digital humanities. Byť, podobně jako v případě definování nových i sociálních médií, se vedou časté spory o přesnou definici.

Ve sborníku Debates in the Digital Humanities[6] můžeme najít 21 odpovědí na otázku, co jsou digital humanities? Velká část těchto definic se týká především průniku mezi komputačními postupy a humanitními vědami jako v případě Johna Unswortha z University of Illinois, který definuje digital humanities jako: „Využití komputačních nástrojů při práci humanitních věd.“ [7] Najdeme tu ovšem i vymezení, která přidávají i fakt, že se jedná o komunitu výzkumníků, kteří se pohybují v oblastech zprostředkovaných digitálními médii. Tyto definice totiž zjevně odkazují na skutečnost, že jedním z motorů výzkumu digital humanities je využívání nových médií jako prostředí pro samotné vytváření vědecké komunity.

Autoři učebnice The Digital Humanities: A primer for Students and Scholars[8] vybírají dvě zásadně odlišné definice digital humanities, které podle nich dobře ilustrují napětí, jež sebou koncept digital humanities přináší.

První definici, kterou autoři zmiňují, je definice z Wikipedie: „Digital humanities is an area of research and teaching at the intersection of computing and the disciplines of the humanities. Developing from the fields of humanities computing, humanistic computing and digital humanities praxis digital humanities embraces a variety of topics, from curating online collections to data mining large cultural data sets. Digital humanities (often abbreviated DH) currently incorporates both digitized and born-digital materials and combines the methodologies from traditional humanities disciplines (such as history, philosophy, linguistics, literature, art, archaeology, music, and cultural studies) and social sciences with tools provided by computing (such as data visualization, information retrieval, data mining, statistics, text mining, digital mapping), and digital publishing.“[9]

Tato definice je podle autorů učebnice v rozporu s inkluzivním vymezením Anne Burdick v publikaci MIT Digital humanities.[10] „[Digital Humanities] asks what it means to be a human being in the networked information age and to participate in fluid communities of practice, asking and answering research questions that cannot be reduced to a single genre, medium, discipline, or institution.“ [11]

Zatímco první z nich se orientuje hlavně na otázku metodologickou a vychází především z dialogu mezi počítačovými vědci a vědci z humanitních oblastí, v druhém případě se jedná o mnohem širší oblast, která de facto padá do oblasti nazývané Manovichem transcoding, tedy vlivu digitální proměny lidské společnosti na člověka samotného. Autoři učebnice sami říkají, že by bylo dokonce lepší pojmenovat takto vymezené oblasti dvěma rozdílnými termíny. Metodologickou část pojmenovat jako digital humanities a část širší pojmout jako humanities computing. Sami se kloní k původnímu vymezení oblasti digital humanities jako primárně metodologické změně v samotné práci v humanitních vědách, která má svůj historický kořen především v nástupu počítačů. Navíc starší práce používají termín humanities computing jako označení samotného pole výzkumu, kde se protínají jednotlivé vědní oblasti a metodologie, jak to ilustruje obrázek z knihy Willarda McCartyho Humanities Computing.[12]

image

Nicméně obecná shoda v této oblasti nepanuje a snad ani není zcela nutná. Důležité je, že jsme vždy nejen na novém poli výzkumu, ale také přicházíme do styku s novým způsobem práce samotné výzkumnické komunity, která využívá nové technologie k efektivnější komunikaci, zrychlení cyklu průzkumu dat, zkoumání hypotéz a konečně i k zpřístupňování velkých datových korpusů kolegům i širší veřejnosti.

Kritika

Ačkoli je digital humanities relativně mladá disciplína (byť s celou řadou úctyhodných předchůdců), je podrobovaná řadě kritických pohledů a to nejen z pohledu kulturní kritiky, ale ze samotného pohledu metodologického. Tuto kritiku shrnují Bernhard Rieder a Theo Rohle v eseji Digital Methods: Five Challenges do pěti výzev, před kterými dle nich digital humanities dnes stojí.[13] Jsou jimi: zdání objektivity (The lure of objectivity), síla obrazu (The power of visual evidence), neznalost metody (Black-boxing), Institutional perturbations a problém universalismu (The quest for universalism).

V doslovu k českému vydání Morretiho knihy Graphs, maps, trees: Abstract models for a literary history jsem se ji pokusil shrnout: pokud věci počítáte, mohou se zdát objektivnější. Vizualizace dat sebou nenese často jen snadnější nahlédnutí pravdy, ale také rétorickou sílu, která může klamat. Moderní technologie přinášejí snadnou dostupnost matematických analýz pro všechny, aniž by bylo nutné rozumět jejich fungování. Často tak můžeme aplikovat datovou analýzu nevhodným způsobem a i přesto dostat odpovědi, které dávají na první pohled smysl. Komputační metody sebou nutně ponesou větší zapojení vědců vzdělaných v jiných oblastech, a budou tak oslabovat původní kontexty, které humanitní vědy vymezují. Zapojení, více méně matematických modelů, ovšem také oživuje představu universální gramatiky světa, která svůj výraz nachází především v matematicky založených vědách.

Digital humanities a DIKW

Kritiku nastíněnou v předchozím odstavci je nutno brát vážně. Nicméně je zároveň třeba vidět postavení digital humanities v širším kontextu procesu znalostí a poznání. Tady nám může posloužit zjednodušený koncept poznání formalizovaný v informační vědě do tzv. pyramidy poznání neboli konceptu DIKW.

image

Zkratka DIKW je utvořena z pojmů Data – Information – Knowledge – Wisdom. Procesu, při kterém z dat získáváme smysluplné informace, které je třeba interpretovat s přihlédnutím k doménové znalosti, jenž se data týkají. Teprve od tohoto pohybu myšlení se lze dostat k samotnému smysluplnému poznání.

V tomto kontextu přinášejí nová média možnost zásadního rozšíření dat, s nimiž můžeme pracovat. V procesu digitalizace (ať již rukopisů či třeba jen geolokovaných záznamů o archeologických nálezech) roste datová základna natolik, že její rozsah již prakticky vylučuje možnosti zpracování bez použití počítačů. Komputační obrat, který přinášejí počítače a jimi zprostředkované zpracování dat, pak rozšiřuje možnost vytěžení informací z těchto dat. Ovšem jejich interpretace z pohledu vědy stále zůstává především v lidském porozumění zkoumané oblasti. Doménová znalost interpretů a vědecká práce zůstává v tomto ohledu stejná, pouze získává zcela nové vstupy pro pochopení světa.

Josef Šlerka

[1] http://www.corpusthomisticum.org/it/index.age
[2] https://en.wikipedia.org/wiki/Data_mining
[3] Český překlad se připravuje k vydání na přelom roku 2015/2016. Citace pocházejí právě z pracovní verze českého překladu.
[4] Poetics 41 (2013) 750–769 online: http://digitalcommons.unl.edu/cgi/viewcontent.cgi?article=1105&context=englishfacpubs
[5] http://lab.softwarestudies.com/p/imageplot.html
[6] Matthew K. Gold, Editor: Debates in the Digital Humanities, University of Minnesota Press, 2012.
[7] Gold, s. 70.
[8] Eileen Gardiner, Ronald G. Musto: The Digital Humanities: A primer for Students and Scholars, Cambridge University Press, 2015.
[9] https://en.wikipedia.org/wiki/Digital_humanities
[10] Anne Burdick, Johanna Drucker, Peter Lunenfeld, Todd Presner, Jeffrey Schnapp: Digital_Humanities. MIT Press, 2012, s. vii.
[11] Willard McCarty: Humanities Computing. Palgrave Macmillan, 2005.
[12] David M. Berry (ed.): Understanding Digital Humanities. Palgrave Macmillan, 2012.

Blog comments powered by Disqus