Humaniora med digitala metoder

Digital Humaniora

Digital humaniora är en forskningsinriktning mot det tvärvetenskapliga, som söker efter att beskriva, analysera och visualisera digitala data inom humaniora. Enligt Kenneth Nyberg är digital humaniora något som är mångtydigt, det går att kan urskilja minst tre olika betydelser.[1] Den första betydelsen som Nyberg nämner är en mycket generell definition där humanistisk forskning på något sätt bedrivs med digitala metoder, men här kommenterar han att denna generella tolkning skulle bli så generös att den skulle kunna inkludera nästan all humanistisk forskning.[2] En av de andra två definitionerna beskriver digital humaniora som ett samlingsnamn för forskningsinriktningar som mer eller mindre hör samman, och där ett digitalt verktyg och metoder används. I den sista, eller tredje, definitionen som Nyberg tar upp, blir digital humaniora snarare ett förhållningssätt, utöver de nya verktyg och metoder som det digitala gjort möjligt. Nyberg skriver att detta förhållningssätt är ”präglat av starkt samhällsengagemang, tvärvetenskaplighet och kritik mot traditionella akademiska strukturer och praktiker i en situation där digitaliseringen på nytt har aktualiserat de grundläggande frågorna om vad kunskap och bildning är.”[3]

Det digitala samhällets humaniora

Idag lever människan i ett digitaliserat samhälle och det har medfört nya möjligheter för forskare, inte bara inom naturvetenskapen, utan även för humanister och många andra ämnesområden. Digitaliseringen har medfört nya sätt att se på hur en vetenskaplig fråga kan ställas och hur svaret kan tas fram. Det kan även ändra på hur humaniora uppfattas och vilka forsknings frågor som kan inkluderas för humanister. Redan finns det olika verktyg som kan hantera enormt stora, mängder av data för kvalitativ analys, som exempelvis insamlats från sociala medier. Nya tvärvetenskapliga analyser har uppkommit med denna teknik. Dock bemöts den tekniska utvecklingen inte alltid med en positiv inställning, något som Matthew Kirschenbaum kommenterar i en av sina artiklar.[4] Den tekniska biten är inte något som traditionellt kopplas till humaniora och det kan vara detta som får ”klassiska” humanister att vilja ta avstånd från det digitala. Och trots att den digitala utvecklingen har fört med sig nya möjligheter i form av material och metoder, visar det sig att det är ”gamla” frågor som nu kan utvecklas och studeras på nytt.[5] För en litteraturvetare kan forskare besvara frågor kring de olika litterära perioderna igenom historien som inte kunnat vederläggas tidigare. Kanske var den romantiska epoken längre än man tidigare trott? Eller finns det ytterligare något som är gemensamt för renässansens författare? Frågor som kan föra någons forskning vidare, men kanske stjälpa någon annans forskning och tillintetgöra alla, eller några, tidigare vedertagna uppfattningar. En sak som forskare behöver ta hänsyn till är det digitalas begränsningar, och  därför tänka på att datorer och digitala program inte kan ersätta en människas tolkning av en text. M. Kirschenbaum skriver i en av sina artiklar om digital humaniora, att digital humaniora är en modifierad införsel av Silicon Valleys solutionism, det vill säga tron på att alla problem har en lösning (ofta en teknisk sådan).[6] Detta kan såklart uppfattas som något tilltalande, för som Kirschenbaum skriver, digital humaniora kan inte foga sig efter kritik, det kan varken ta hänsyn till eller bryr sig om etnicitet, klass, kön eller sexualitet.[7]

Digital humaniora är någonting som under en lång tid ansetts stå utanför resten av humaniora, men börjar nu inkorporeras i olika discipliner, som exempelvis historia och litteraturvetenskap. Det finns många fler ämnesområden som kan ha användning för digital humaniora och de olika metoder som finns tillgängliga i och med den digitala utvecklingen. Matthew Jockers och Ted Underwood skriver i sin text om en av de mer använda metoderna inom digital humaniora.[8] Båda författarna menar att text mining är en av de mer använda metoderna inom digital humaniora.

Matthew Jockers är, tillsammans med Franco Moretti, en av de forskare som har använt en av de större digitala metoderna, text mining, som grund i sina projekt och undersökningar. Och båda anser text mining vara en huvudkomponent i humanioras digitala verktygslåda och en god metod för de humanister som önskar använda digital analysmetod.

Text mining

Det som idag kallas text mining, eller digital textanalys, började utvecklas under 1960-talet, men blev mer etablerat under 80- och 90-talen.[9] Text mining är en tillämpning av idén ”Big Data”, det vill säga stora mängder data. Inom digital humaniora handlar det om textmängder, snarare än numerisk data. När man använder sig av text mining innebär det ofta att man letar efter någonting i en samling texter, detta kan vara olika mönster eller samband i den stora mängden ostrukturerad data. Text mining är inte en form av sökmotor inom texter. Men man kan tillexempel använda metoden för att hitta de mest frekvent använda orden i en text och inom vilka sammanhang orden används. Text mining är tillsammans med datavisualisering två nya metodologiska huvudspår inom digital humaniora.[10] Dessa två huvudinriktningar inom digital humaniora kan med fördel kombineras med varandra för att visualisera och sedan studera de resultatdata som uppkommit från text miningen. Detta är inte den enda av digitala metoder som används av forskare inom digital humaniora, men det är den som jag kommer att utgå ifrån i följande stycke och när undersökningen av tre program görs.

Digitala verktyg

Det finns många olika program för att hantera digitala metoder för dataanalys, eftersom det är näst intill omöjligt att utföra text mining manuellt, för hand. Programmen är utformade till att vara så användarvänliga som möjligt eftersom dess användare, oftast humanister, i relativt få fall har kunskap i kodning och programmering. Istället presenterar programmen analysen som visuella resultat, men även tabeller med antalet räknade förekomster av ord, och liknande data för att man skall kunna utföra sin analys. Exempel på program som kan assistera vid olika former av lingvistiska eller litteraturvetenskapliga textminingprojekt är NVivo, Atlas.ti och Voyant Tools, vilket är de tre program som jag har valt att undersöka för att avgöra vilka för- och nackdelar de presenterar för en forskare, vars önskan är att använda sig av dessa program för text mining.

Textens digitala verktyg

NVivo och Atlas.ti kan båda hantera flera olika varianter av data-filer utöver text, till exempel video, ljud och bild, någonting som Voyant Tools inte klarar. Utöver denna möjlighet kan alla tre program ta in stora mängder ostrukturerad kvalitativ data och, för att beskriva det enkelt, göra om det till kvantitativ data, det vill säga numerisk data. Det är sedan de numeriska data vilka programmen sammanställer för att användaren skall kunna dra egna slutsatser kring vilka mönster och samband som förekommer i texten. Ytterligare en viktig del av programmens funktioner är att de kan visa i vilka kontextuella sammanhang som ett ord förekommer. Detta genom att studera vilka övriga ord som ofta förkommer i närheten inom texten. Någonting som dock är viktigt att hålla i åtanke för den som jobbar med digitala verktyg, är att även om resultatet kan uppfattas vara givande, bör forskaren problematisera vad sådana analyser faktiskt säger och även att programmen bara kan presentera ett möjligt porträtt av textens sammanhang och mönster, någonting som Kenneth Nyberg påpekar när han skriver om hur datavisualisering och textmining även kan användas inom historia.[11]  Beroende på vilken typ av forskningsprojekt som skall genomföras bör man anpassa sitt val av digitalt verktyg,  och avgöra om det är lämpligt att besvara forskningsfrågan med hjälp av ett program. Voyant Tools är ett relativt simplistiskt verktyg, i jämförelse med de andra två programmen NVivo och Atlas.ti. Som nämndes tidigare kan Voyant Tools inte hantera data utöver textbaserad data. Utöver det begränsade antalet filtyper, har Voyant Tools inte heller möjlighet till att erbjuda en anpassning för mixade metoder, eller blandade metoder.[12] Med mixade metoder menas att en användare kan applicera fler än en metod, och kan tillämpa flera stycken samtidigt. Huruvida det är en positiv eller negativ möjlighet att som forskare kunna blanda metoder använda flera olika metoder i sin analys är en svår avvägning. Själv kan jag tycka att det blir en positiv egenskap som programmen kan tillhandahålla i ens forskning. Det kan även öka forskarens förståelse om vad de data som framträder faktiskt betyder när det går att applicera flera olika metoder under studiens fortgång. Dock kan det även användas på ett felaktigt sätt, exempelvis när en forskare utför en undersökning och letar efter en metod som bekräftar det forskaren vill, eller förstår, och sedan utelämnas de olika leden i processen och kvar blir bara den metod som ger önskat resultat. (Här får man helt enkelt lita på respektive forskares integritet, något som även gäller för forskare som inte använder digitala verktyg).

En annan påtaglig fördel med att använda ett digitalt verktyg är, som tidigare kommenterats, den tänkbara visualiseringen. Det kan underlätta, så att det blir lättare att se mönster och samband. Visualiseringen av textdata, bygger på numeriska data som extraherats från samlingen av texter, materialet, på vilken forskaren applicerar sin metod. Det är utifrån dessa resultat av kartor, diagram och tabeller som forskaren sedan kan utföra sina analyser. Och det är sedan dessa visualiseringar som anses vara statistiken på vilken forskaren grundar sina slutsatser på. Det som sedan är viktigt att ha i åtanke när bearbetning av statistiska data utförs är att hantera den med korrekt analysmodell, eftersom forskaren använder de statistiska analyserna till att understryka och verifiera sina resultat och slutsatser. För att resultatet skall uppfattas som trovärdigt behövs en sakkunnig statistiker för att verifiera siffrorna. Och trots att digital humaniora och de humanister som brukar dessa verktyg ofta inte har tillräcklig kompetens, ingår dessa statistiska analyser numera i deras analysprocesser. En annan aspekt av statistik, som kan tyckas självklar, är att det inte är en absolut sanning, eller hela sanningen eller så kan siffrorna vara helt felaktiga, det hela beror på hur man fått fram sin statistik.

De statistiska inkorrektheter som kan uppkomma på grund av okunskap, minskar ju mer den enskilde forskaren använder verktygen. Men det är också viktigt att komma ihåg att inte lägga all sin tillit till att datorn löser problemet. En viktig del av tillexempel litteraturvetenskapen är den mänskliga faktorn som existerar i en text. Mycket av en författares intention med en text kan läsas in ”mellan raderna” men detta är någonting som en dator inte klarar av. Ett program kan inte läsa in om en text är romantisk, ironisk, har några gömda budskap eller någon annan nyans som kan vara några lager under den faktiska innebörden av en text. Nyberg för ett liknande resonemang när han skriver om hur en historiker kan ha användning av digitala medel och databaser, för att genomföra sina studier.[13] Det gäller att vara medveten om de begränsningar som digitala program medför. Ett kritiskt tänkande och granskning av ens material blir än mer viktigt i och med ökningen i användandet av digital humaniora.

Naturvetenskaplig humaniora?

Som jag skrev tidigare i texten blir statistiska analyser en allt större del inom humaniora, och då framför allt för den som arbetar med den digitala delen av området. Denna utveckling till en mer numeriskt inriktad humaniora understödjs av de program som blir allt mer användarvänliga, något som jag definitivt tycker att de tre program som jag har gått igenom har varit. Och som jag också påpekade tidigare ingår inte statistik i en humanists vanliga repertoar, men det är ändå på väg att bli en del av deras analysprocess. Visserligen är digital humaniora ett tvärvetenskapligt forskningsområde, men som jag har uppfattat saken är det ofta som statistiker inte är med i forskningsgruppen. Detta kan ha många anledningar, bland annat att det finns mycket få utbildade statistiker, men också att det inte finns finanser till att inhyra alla kompetenser som kan tänkas behövas. Men oavsett anledningen till att kunskap kring statistik fattas löser det inte problemet med statistiska analyser och de konsekvenser dessa resulterar i. I och med digitaliseringen av data och att humanister nu använder nya metoder för att svara på både gamla och nya frågeställningar och hypoteser, måste även kunskaperna utökas. Det är inte endast tekniska lösningar som kan appliceras när ett problem uppstår, eftersom det inte alltid är ett ”tekniskt” problem.

En annan fråga som uppstår för mig, blir hur mycket humaniora som finns kvar om datorerna och tekniken tar mer och mer plats? Humaniora är den vetenskap i vilken forskaren studerar människan som kulturell varelse, och det kulturella har förflyttats. Vi umgås i allt större utsträckning via våra datorer, är ute på sociala medier och sprider intim information om oss själva, en beteendevetares dröm? Kanske, men det mänskliga tycks mig försvinna in i ett allt mer odefinierbart töcken och gränser suddas ut. Som litteraturvetare skapas det nya variabler att ta hänsyn till och det innebär såklart både för- och nackdelar när, så gott som, alla är författare. Säkerheten i forskarens slutsatser måste underbyggas med mer än ”bara” rimliga och logiska argument, statistiken blir en viktig stöttepelare inom de humanistiska vetenskaperna. Detta är något som funnits inom de naturvetenskapliga ämnena under en längre tid, sedan 1700-talets upplysnings ideal etablerades. Och eftersom det naturvetenskapliga sättet att tänka har varit normen, det eftersträvansvärda, inom det akademiska, ställer jag mig frågan om humanisterna kommer att anpassa sig för mycket till andra discipliners tankesätt? Såklart är det viktigt att kunna arbeta utanför sin egen expertis och med andra vetenskaper, men som humanist får man inte glömma det mänskliga i dessa studier. Program som NVivo, Atlas.ti och Voyant Tools kan vara till stor hjälp för forskare att organisera och analysera stora mängder ostrukturerad data, men de kan inget säga om vare sig människan eller samhällskulturen. Eller är vi så beroende av det digitala idag att vetenskaperna måste ändras, för att samhällets utveckling inte längre existerar i det analoga? Och om digital humaniora är nästa steg inom humanistisk forskning, skall en annan disciplin får ”leda” vägen?

 

Litteraturförteckning

[1] Nyberg, K. (Maj 2014). Digital Huamniora: definitioner och debatter. i K. Nyberg, & J. Parland – von Essen, Historia i en digital värld (ss. 44-48). Göteborg: digihist.se. Hämtat från Historia i en digital värld: https://digihist.se/3-forskarvarldens-respons/digital-humaniora-definitioner-och-debatter/

[2] Ibid.

[3] Ibid.

[4] Kirschenbaum, M. G. (2014). What Is ”digital Humanities”, and Why Are They Saying Such Terrible Things About It? difference 25.1, ss. 46-63.

[5] K. Nyberg, Betydelse(r) för forskningen, Historia i en digital värld, maj 2014, s. 52

[6] Kirschenbaum, M. G. (2014). What Is ”digital Humanities”, and Why Are They Saying Such Terrible Things About It? difference 25.1, (ss. 46-63.), s. 50

[7] Ibid. s. 51

[8] Jockers, M. L., & UnderWood, T. (2015). Text‐Mining the Humanities. i S. Schreibman, R. Siemens, & J. Unsworth, A New Companion to Digital Humanities (ss. 291-306). Online: John Wiley & Sons, Ltd.5

[9] Grimes, S. (den 30 Oktober 2007). A Brief History of Text Analytics . Hämtat från BeyeNetwork: http://www.b-eye-network.com/view/6311

[10] K. Nyberg, Betydelse(r) för forskningen, Historia i en digital värld, maj 2014, s. 51

[11] K. Nyberg, Betydelse(r) för forskningen, Historia i en digital värld, maj 2014, s.51-52

[12] Från engelskans mixed methods, http://www.qsrinternational.com/blog/using-nvivo-for-mixed-methods-research,  hämtat: 2016-10-12

[13] Nyberg, K. (Maj 2014). Big Data. i K. Nyberg, & J. Parland – von Essen, Historia i en digital värld (ss. 116-120). Göteborg: digihist.se. Hämtat från Historia i en digital värld: https://digihist.se/3-forskarvarldens-respons/digital-humaniora-definitioner-och-debatter/, s. 117-120.

Annonser

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Google+-foto

Du kommenterar med ditt Google+-konto. Logga ut /  Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s