En gemensam produktion av Deaf Journalism Europe av Wille Felix Zante (Taubenschlag/manua) och Jos de Winde (DNieuws/Turkoois).
Sammanfattning
Ökningen av artificiell intelligens (AI) såg nästan omedelbart flera startups som hävdade att de hade löst det pågående problemet med att teckenspråksavatarer inte var tillräckligt bra. Teckenspråksavatarer är i grunden verktyg som mer eller mindre syftar till att översätta talat eller skrivet språk till teckenspråk genom animerade datorfigurer som liknar lågkvalitativa Pixar-liknande animerade karaktärer. Dessa har drabbats av ”uncanny valley”-effekten, fenomenet där datoranimationer nästan ser levande ut men för det mänskliga ögat ändå ser direkt ”fel” ut. Detta innebär att teckenspråksavatarer som ersättning för mänskliga översättningar är i stort sett mestadels oanvändbara eftersom de kräver nästan lika mycket arbete eller kostar lika mycket som mänsklig översättning. Hösten 2023 gjorde ett företag i Tyskland en stor medieframgång genom att sälja teckenspråksavatarpaket till kommuner över hela landet, och media rapporterade att AI kunde användas för att göra texter tillgängliga. Det mycket tveksamma resultatet kritiserades med rätta av en lokal dövinitiativgrupp. Samtidigt meddelade Tyska dövas förbund, DGB, att de uttryckligen avrådde från användningen av avatarer eftersom tekniken ännu inte är mogen nog. Intressant nog var DGB:s talesperson involverad i ett av de döva företag som samarbetade med det avatarproducerande (hörande-ledda) företaget. Vår forskning visade också att det potentiellt finns miljoner att tjäna på att sälja denna relativt ”lågkvalitativa” och tvivelaktiga lösning till kommuner i hela landet, eftersom tysk lag kräver att offentliga institutioner har teckenspråkstillgänglighet inbyggd i sina webbplatser. Ämnet är komplext, och vi försökte vårt bästa för att sammanfatta det i denna korta sammanfattning. För fler detaljer, läs hela originalartikeln som går på djupet och belyser avatar-/AI-kapplöpningen från ett tyskt perspektiv. Vi hoppas att ni uppskattar detta försök att göra komplex granskande journalistik tillgänglig för dövgemenskapen.
Genom historien har dövsamhället mött tekniska innovationer med en blandning av hopp och oro. Från telefoners och radiors ångestskapande ankomst till tv:ns tysta era och faxmaskiner, har varje framsteg fört med sig sina egna utmaningar och möjligheter. Nu, när vi står på tröskeln till en ny teknologisk era, präglad av framväxten av avatarer och artificiell intelligens, befinner sig dövsamhället vid ännu ett vägskäl. Men vad innebär detta för samhället idag, och hur passar det in i den bredare berättelsen om teknologisk utveckling? Dessa frågor kommer att utforskas, och de ekonomiska och samhälleliga konsekvenserna för dövsamhället kommer att klargöras. Vi hade möjlighet att ta del av insikterna från en expert på ”Deaf Studies, språkpolicy, teckenspråkstolkning och AI-teckenspråksteknologier”, Maartje De Meulder, samt Ralph Raule, tillgänglighetsentreprenör inom dövsamhället och digitaliseringsförespråkare vid Tyska dövas förbund.
Efter tre års forskning och utveckling lanserades i slutet av 2023 teckenspråksavatarer på tyska kommuners webbplatser. Verktygspaketet, som fick namnet ”Kommunaler Gebärdensprach-Avatar-Baukasten” (”kommunalt teckenspråksavatar-kit”, kort ”KGA-Baukasten”), byggde på ett forskningsprojekt kallat AVASAG, lett av Charamel och yomma, två företag baserade i Köln respektive Berlin. Verktygspaketet, baserat på detta, var ett erbjudande från Charamel. Målet var enkelt: att skapa ett mer kostnadseffektivt sätt att göra webbplatser tillgängliga, baserat på idén att de flesta skriftliga innehåll som exempelvis information om dataskydd enligt GDPR i stort sett är utbytbara mellan webbplatser.
För denna artikel undersökte Deaf Journalism Europe den aktuella situationen i Tyskland där Tyska dövas förbund nyligen avrådde från användningen av teckenspråksavatarer med anledning av att semi-automatiserade avataröversättningstjänster blivit allt vanligare. Vi använder detta som en utgångspunkt för att utvärdera risker och möjligheter för dövsamhället. Den döva forskaren Maartje De Meulder, som vi intervjuade via e-post, bidrog med sin akademiska synvinkel på ämnet som korsar teknologi, etik och ekonomi.
Historien om teckenspråksavatarer går tillbaka till 1982 och föddes ur behovet att översätta teckenspråk till skriven information. Detta arbete stötte dock på stora svårigheter. Till skillnad från skriftspråk har teckenspråk ingen universellt accepterad skriftlig form utan bygger istället på olika notationssystem såsom HamNoSys eller Stokoe-notation, som inte är lätta att översätta. Dessutom försvåras processen av bristen på uttömmande korpus för teckenspråk, vilket hindrar framsteg liknande de som gjorts inom transkribering och översättning av skriftspråk med hjälp av teknologier som DeepL eller Google Translate.
Det långsiktiga målet med avatarer är att ersätta mänskliga tolkar, vilket vi kommer att diskutera med forskaren Maartje De Meulder senare i artikeln. På kort sikt är det dock ännu inte möjligt att göra detta, men flera projekt har producerat förståeligt, om än långt ifrån perfekta, avatarer. Även om många forsknings- och kommersiella projekt har involverat döva yrkespersoner, väckte ett projekt kontrovers förra året genom att erbjuda avatarer direkt till växande officiella institutioner och kommuner i jakten på kostnadseffektiva sätt att uppfylla annars mycket generösa tillgänglighetsregler i Tyskland. Det är tydligt att huvudmålet här är kostnadsbesparing, samtidigt som man löser problemet med tillgången till tolkar/översättare.
Forskning från DJE-partners visade en rapport som diskuterade tillämpningen av det kommunala avatarprojektet i en stad. Rapporten, som används för att informera ett beslut av stadens parlament, anger en kostnad på 3 750 euro per år – ett verkligt fynd jämfört med de påstådda 170 euro per timme som en mänsklig teckenspråkstolk skulle kosta. Siffran baseras på den allmänt accepterade timtaxan i Tyskland för två tolkar i de flesta sammanhang, vilket är 85 euro per timme för en person. Rapporten nämner inte att översättare för film generellt tar ännu mer betalt baserat på resultatet: mellan 70 och 120 euro per minut film. Det är förstås svårt att jämföra tolkning och översättning och visar hur lite de personer som i slutändan fattar dessa beslut vet om ämnet.
En nationell dövförbundsrepresentant i en dubbelroll – mellan handel och politik
Oavsett vilket skulle kostnadsbesparingarna i dessa fall vara påtagliga och ge kommuner och andra offentliga instanser ett starkt incitament att övergå till avatarer som på lång sikt skulle kunna automatiseras allt mer. När forskningsprojektet AVASAG startade för tre år sedan arbetade Charamel och yomma glatt tillsammans, men hösten 2023 började de första sprickorna synas.
Kompetenzzentrum Gebärdensprache i Bayern (KOGEBA, svenska: ”Kompetenscenter för teckenspråk i Bayern”), ett nytt initiativ med nära koppling till Dövförbundet i München, protesterade mot användningen av teckenspråksavatarer och kritiserade att en av de personer som var involverade i samarbetet mellan Charamel och yomma hade en dubbelroll som nationell dövförbundsrepresentant När DJE:s partners ställde frågor hävdade både företagets talespersoner och NAD-representanten att allt hade gått rätt till och att representantens expertis och tekniska bakgrund var just de skäl som gjorde honom delaktig i projektet.
Samtidigt började avatarer skapade av Charamel med hjälp av verktygspaketet som utvecklats inom AVASAG-projektet dyka upp på webbplatser över hela landet, identiska men anpassade till de städer vars innehåll de påstod sig översätta.
Fram till våren 2024. Det bayerska initiativet publicerade ett nytt offentligt uttalande där de granskade avatarerna som producerats med verktygspaketet. Denna gång fokuserade de på webbplatser som redan hade implementerat avataren, såsom Zeppelinmuseet i Friedrichshafen och flera andra webbplatser, främst kommunala, som använde det kommunala avatarverktyget från Charamel. De fann att avatarerna brister, särskilt när specialord som städernas namn används. Bokstaveringen kritiseras för att vara för långsam, för utdragen, tecknen är svår att förstå, enligt KOGEBA.
Dagar senare publicerade NAD, i samarbete med den nationella föreningen för teckenspråkslärare, den nationella föreningen för hörselskadade och den auktoriserade dövtolkföreningen, ytterligare ett kort och ”preliminärt” uttalande angående användningen av avatarer: de rekommenderade starkt mot det. Presentatören var ingen mindre än NAD-representanten som tidigare kritiserats för sin dubbelroll i AVASAG-forskningsprojektet: Ralph Raule. Vad orsakade denna splittring? Vi tog kontakt med yomma, Charamel och förstås Raule. Alla svarade, förutom yomma som ursäktade sig djupt men sa att de för tillfället inte kunde svara. Vid tidpunkten för publiceringen av denna artikel hade de inte svarat. NAD hade heller inte publicerat det slutgiltiga gemensamma uttalande som utlovats. När vi intervjuade honom våren 2024 insisterade Raule på att vi citerade honom som NAD-representant och inte i hans roll på yomma.
Men först och främst, vad är avatarer?
Avatarer är digitala representationer som används i virtuella miljöer. En teckenspråksavatar är en gestikulerande animerad figur. Teckenspråksavatarer talar teckenspråk. Det finns olika tekniker som kan användas för detta.
Den första är genom rörelsefångst, där tecknarna bär en dräkt med markörer. Kameror från olika vinklar fångar rörelserna, och markörerna hjälper till att överföra rörelserna till animationer som de digitala figurerna använder.
Den andra metoden är genom kodning. Detta innebär att element som handformer, handposition och riktning, liksom ansiktsuttryck, munformer, ögon och ögonbryn, omvandlas till kod. Dessa programmeras sedan till rörelser.
De två metoderna kan också kombineras, där rörelsefångst används för enstaka gester och manuell instruktion används för övergångar och kombinationer av gester.
Har avatarer ett syfte?
Maartje de Meulder, en döv forskare från Belgien, säger: ”Absolut, det finns definitivt vardagliga användningsområden för teckenspråksproduktion/generering i form av avatarer (virtuella människor), exempelvis inom hotell- och turismsektorn och för semi-automatiserad kundinteraktion (jämförbart med chattbotar).” De Meulder beskriver sig själv som verksam inom området ”Deaf Studies, språkpolicy, teckenspråkstolkning och AI-teckenspråksteknologier.” Hon är nyfiken på hur dessa områden ”påverkar dövas dagliga liv och rättigheter, och i ett bredare perspektiv även rättigheterna kring teckenspråk.”
Avatarer har en tydlig fördel jämfört med levande tolkar i vissa användningsområden. Det finns många platser där avatarer skulle kunna användas istället. På tåg, på flygplatser, på sociala medier eller för att göra platser mer tillgängliga, särskilt om man inte vet om det kommer att finnas döva teckenspråksanvändare där. Avatarer bör helst inte vara avsedda att ersätta teckenspråkstolkar utan snarare komplettera dem. ”Automatiserad översättning kan bidra till att avhjälpa några av de nuvarande begränsningarna med mänskliga teckenspråkstolkningstjänster, men detta kommer att kräva betydande tekniska framsteg,” säger De Meulder.
I framtiden skulle man kunna använda en avatar i situationer där ingen tolk är tillgänglig, eller kanske i situationer där man föredrar att inte ha en tolk. Språkteknologi är i grunden en positiv utveckling, men mycket återstår att göra för att göra den användbar. Det kan också tänkas i kontexten av döva barn och deras hörande föräldrar. När det gäller att lära sig teckenspråk kan en avatar också fungera som ett komplement, till exempel mellan lektioner, så att föräldrar som vill lära sig teckenspråk får fler möjligheter att öva. Generellt kan avatarer bidra till att öka medvetenheten och synligheten för teckenspråk.
Varför är döva så emot avatarer?
Det finns en viss motvilja mot användningen av teckenspråksavatarer inom dövsamhället. De Meulder kommenterar detta:
”För närvarande är de flesta avatarer som presenteras för döva användare prototyper och kanske inte fullt ut möter användarnas behov. Vanligtvis samlar hörande utvecklare in feedback i laboratoriemiljöer, vilket inte nödvändigtvis speglar verkliga användningssituationer. Risken med att fråga om den här typen av feedback är att döva personer ser avatarernas teckenspråk som en ytterligare teckningsstil de måste stå ut med och lära sig att ’förstå’ (precis som de måste lära sig att förstå tolkarnas teckenspråk). Detta kan leda till socialt önskvärda svar.” Det finns också en risk för att respondenterna i undersökningarna omedvetet kan vara partiska: ”Respondenterna kanske säger att de förstod bara för att de tror att de förväntas uppskatta denna teknik som är gjord ’för’ dem.” Ett problem med forskningen inom detta område är att det saknas tillförlitlig praktisk data: ”Det är en stor skillnad mellan att titta på en avatar på en skärm i sitt eget kontor under ett kort experiment och att behöva se den under ett nervpåfrestande läkarbesök.”
De Meulder fortsätter att tala om förväntningarna inom dövsamhället: ”Vissa döva människor kan ha höga förväntningar på teckenspråksavatarer och hoppas på en magisk lösning som kan förbättra tillgängligheten. Det är viktigt att hantera förväntningarna noggrant och inte översälja teckenspråksteknologins kapacitet.”
Hon ser dock risken att regeringar kan använda avatarer som en billig lösning istället för full tillgänglighet: ”Många döva människor oroar sig för att regeringar kommer att välja den kostnadseffektiva vägen med medelmåttig maskinöversättning istället för mänskliga tolkar i vissa situationer och att döva människor kommer att tvingas acceptera maskinöversättning i situationer där det inte är motiverat. Denna oro kommer från bredare erfarenheter av hur regeringar och andra institutioner hanterar språklig mångfald och flerspråkighet. Vi vet att detta är en hal backe: döva personer har till exempel motsatt sig användningen av digitaltolkning på sjukhus, men det är nu i stor utsträckning accepterat att använda digitaltolkning i vissa medicinska situationer.”
Teckenspråksavatarer: Navigera i teknik, aktivism och etiska överväganden
Kritik mot teckenspråksavatarer har funnits sedan 2018, då Världsförbundet för Döva (WFD) tillsammans med Världsorganisationen för Teckenspråkstolkar (WASLI) publicerade ett uttalande om användningen av teckenspråksavatarer. Den huvudsakliga kritiken var att datorgenererade översättningar inte kunde uppnå samma kvalitet som mänskliga tolkar, särskilt när det gäller sociolingvistiska och sociokulturella aspekter. Särskilt i livshotande situationer där döva befinner sig i nödsituationer bör avatarer aldrig användas, eftersom felmarginalen är för hög och – detta är ytterligare en viktig aspekt i sig – det saknas tvåvägskommunikation med avatarer. Det innebär att information kan översättas men döva skulle inte kunna svara eller ens be om förtydliganden. Precis som med teckenspråkshandskar verkar avatarforskningen i stor utsträckning ignorera att döva faktiskt kan och gärna vill svara. Detta är något som avatarer ännu inte kan leverera år 2024, sex år efter WFD/WASLIs gemensamma uttalande.
De Meulder skiljer mellan användningen i ”nödsituationer”: ”Det är viktigt att prioritera tillämpningsområden och identifiera de forskningsagendor som är problematiska och lämna utrymme för dem som inte är det. Det finns en skillnad mellan exempelvis en avatar som presenterar information på en myndighetswebbplats och en avatar som används för att medla kommunikation under en livshotande vårdsituation. Genom att prioritera och särskilja olika tillämpningsområden förbättras teknologin på ett sätt som gör det mer troligt att den kommer att accepteras av slutanvändarna. Det är också viktigt att prioritera inom tillämpningsområden och göra distinktioner mellan olika användningar inom samma område. Till exempel är inte alla applikationer inom vårdområdet desamma. Vissa kan vara användbara, exempelvis vid incheckning på sjukhus, medan andra bör förbli förbjudna, till exempel vid livshotande operationer eller andra kritiska fall.”
År 2019 följde tre österrikiska föreningar upp med fler uttalanden som avrådde från användningen av avatarer. Lingvistföreningen Verbal varnade för att avatarer skulle få teckenspråket att framstå som ett ”konstgjort” språk och beröva döva, särskilt barn, förebilder. De avfärdade huvudargumentet för avatarer, att de skulle vara en billigare översättningslösning i längden, genom att påstå att mänskliga rättigheter, såsom rätten till tillgång till kommunikation, inte kan värderas i pengar. De oroar sig för att ökat stöd för avatarforskning skulle leda till mindre finansiering för verklig teckenspråksforskning och stöd för österrikiskt teckenspråk, som är erkänt som ett världsarv av FN. Österrikes dövförbund (ÖGLB), liksom WFD och WASLI tidigare, är överens om att forskning och produktion av teckenspråksavatarer alltid ska ledas, övervakas och utvärderas av döva yrkespersoner. ÖGLB uttrycker oro för att döva personer kommer att bli mer och mer irrelevanta för representationen av teckenspråk.
Alla föreningar, inklusive Europeiska dövförbundet (EUD), är överens om att teckenspråksavatarer kan vara tillåtna för icke-vital information, som försenade tåg och väderprognoser. Däremot är de också eniga i motsatsen: avatarer ska aldrig användas för viktig information, som i nödsituationer eller katastrofer.
För De Meulder är det nödvändigt att förespråkare stöder sina argument mot avatarer med fakta och egen forskning: ”Dövorganisationer måste förbereda sig för potentiellt omvälvande förändringar orsakade av framsteg inom språkteknologi, särskilt maskinöversättning. Jag skulle säga: se mot horisonten. Dövförbund kan proaktivt bidra till att forma policyer som förutser framtida utvecklingar och säkerställer att döva människor fortsätter att ha valmöjligheter för hur de får tillgång till information. En annan fråga som dövförbund (och teckenspråkstolkföreningar och utbildningsprogram!) måste fundera över är hur detta kommer att påverka teckenspråkstolksyrket.”
Det står nu klart att avatarernas framväxt, som en teknologisk tsunami, inte kan stoppas och att dövsamhället måste följa och engagera sig i denna utveckling för att inte återigen förlora tillgänglighetsframsteg. Men vi kan ställa oss frågan om etik kring detta engagemang. Detta är faktiskt ett problem både inom den akademiska världen för döva och inom dövpolitikens värld.
Dövsamhället och deras engagemang i avatarutvecklingen: en knepig position
Det tyska dövförbundet (DGB) har varit tysta i frågan om teckenspråksavatarer, påminner Ralph Raule, den nuvarande representanten för media och digitalisering vid det tyska förbundet. Vi talar med honom om det preliminära uttalande som hastigt publicerades 2024, bara några dagar efter det andra uttalandet från den bayerska KOGEBA-initiativet. De hade redan protesterat mot AVASAG-projektet i november 2023 och hävdat att projektet, som startades 2020, inte involverade döva yrkespersoner i relevanta stadier av produktionen av teckenspråksavatarer.
Viktigare är deras kritik av Ralph Raules inblandning i AVASAG, ett kommersiellt projekt, samtidigt som han innehar representantrollen inom DGB. Raule, som grundade och har en andel i ett företag för teckenspråksfilmproduktion vid namn yomma, förnekade dessa påståenden, tillsammans med alla projektpartner i AVASAG. De hävdar också, i motsats till kritik från KOGEBA, att döva yrkespersoner faktiskt har varit inblandade. Det var i november 2023.
Sedan dess har dokument från kommuner dykt upp samma höst där prissättningen för teckenspråksavatarer som levererats av Charamel diskuterades. Specifikt diskuterade Landkreis Tuttlingen finansieringen och implementeringen av avataranvändning på deras webbplatser. För två år angavs kostnaden till 3 750 €, med ytterligare ”gratis” täckning under två år. Detta skulle innebära en kostnad på 3 750 € för fyra år. Det är oklart om det kommer att vara detsamma framöver. ”Vi är övertygade om att vi kan minska användningen av ’riktiga’ teckenspråkstolkar genom användning av digitala avatarer”, står det i dokumentet. ”Riktiga” (sic!) teckenspråkstolkar anges till 170 € per timme för två personer. Med denna taxa, som exkluderar andra avgifter som resekostnader, kan man bara täcka cirka 22 timmars tolkning för samma belopp som Charamel skulle fakturera för fyra år. Dokumentet fortsätter med att jämföra den digitala avataren med text-till-tal-funktioner som redan implementerats på deras webbplatser. Dokumentet meddelade också tyst införandet av dessa avatarer på kommunala webbplatser vid årsskiftet 2023/2024.
Söderns vakthund slår till igen
KOGEBA, alltid vaksamma, missade inte detta. I sitt andra uttalande, publicerat på Alla hjärtans dag 2024, listar de 23 kommuner som använder teckenspråksavatarer. Bland dem finns München, Duisburg, Würzburg och Regensburg, stora tyska städer. Om priset är detsamma över kommunerna innebär det en försäljningsvolym på drygt 86 000 €. (Charamel uppger en uppskattad minimilicensavgift på 1 000 € per år, vilket låter rimligt i jämförelse med de 3 750 € för vad som i praktiken innebär fyra års användning av avatarer). Tyskland har drygt 10 000 kommuner, vilket möjliggör en potentiell försäljningsvolym på 37 miljoner euro över fyra år med ett koncept som är betydligt billigare än verkliga teckenspråkstolkar. Det finns stora pengar att tjäna på att utveckla, testa och licensiera avatarer.
Efter KOGEBAs andra uttalande reagerade det tyska nationella dövförbundet, DGB, snabbt och tillsammans med nationella förbundet för teckenspråkslärare, nationella förbundet för hörselskadade och föreningen för certifierade dövtolkar, publicerade de ett uttalande som tydligt avråder från användningen av teckenspråksavatarer.
Detta uttalande presenterades av Ralph Raule, samma representant vars inblandning i avatarprojektet AVASAG genom sitt företag, yomma, tidigare kritiserats. Hur skedde denna förändring i inställning?
Raule klargör några saker direkt i en e-postintervju. De avatarer som kritiserades i det andra uttalandet, särskilt de som används av Zeppelinmuseet i Friedrichshafen, var experimentella, säger han. ”Grundtanken var att testa: se vad vi behöver och hur långt den tekniska utvecklingen kommit för att senare utveckla ett bra avatarsystem.” Det som ses idag på Zeppelinmuseets webbplats är rent experimentellt och de personer som användes för rörelseinspelning var inte utbildade eller certifierade som tolkar. ”Det hade varit klart från början att detta endast skulle användas efter att kvalificerade yrkespersoner hade verifierat att det uppfyllde produktionsstandarderna”, säger han. ”Det är tydligt för alla som kan teckenspråk att avataren i detta skick inte är lämplig för publicering.” Han understryker återigen att han varit bestämd med att inte använda de experimentella videorna på publika webbplatser. ”På yomma blev vi överraskade eftersom testmaterialet vi spelade in publicerades för Zeppelinmuseet. Charamel agerade som om det var en mogen produkt.”
Alexander Stricker, ägare av Charamel, företaget som nu säljer sin avatar till kommuner i hela landet, berättar i ett mejl att ”det är mycket viktigt för oss att involvera slutanvändarna i ett tidigt skede”. Produkten, fortsätter han, ”utvecklas genom en serie iterativa, det vill säga kontinuerliga, processer”. Han säger att han är ”speciellt tacksam” för det andra KOGEBA-uttalandet som han menar hjälper Charamel att förbättra sin teknik.
När Raule fick frågan om varför DGB:s preliminära uttalande kom så snabbt efter KOGEBA:s andra uttalande, medger han att DGB arbetade på ett uttalande redan 2020, men att det tyska förbundet inte var nöjda med det eftersom teknologin utvecklades så snabbt. De hade samtal med KOGEBA i december 2023. Raule säger att KOGEBA frågade varför de ännu inte hade publicerat sitt uttalande och om det berodde på hans dubbla engagemang med yomma/AVASAG och DGB. ”Denna fråga fick mig att ompröva och slutligen färdigställa uttalandet”. Han klargör att uttalandet är resultatet av fyra stora föreningar och därför involverar en mycket specifik formulering. Uttalandet är nära kopplat till deras försök att skapa en enhetlig riktlinje för teckenspråkskvalitetsstandarder i media och översättning. Framstegen inom avatartekniken satte press på att få ut uttalandet, säger Raule. ”Många myndighetspersoner verkar anta att avatarer är en universal lösning för dövas tillgänglighet utan att fråga dövsamhället vad de tycker om avatarer.”
Sedan det kommunala avatarprojektet blev offentligt rapporterar allt fler tidningar att det snart kommer vara möjligt att använda AI för att översätta skrivet eller talat (auditivt) språk till teckenspråk. När de hörande journalisterna utan bakgrund i teckenspråk tillfrågades om detta avslöjade de att de syftade på just det kommunala avatarprojektet, samma sak som kritiserats av KOGEBA och bedömts som olämpligt för produktion. Vi frågade Alexander Stricker från Charamel om det klargjordes för yomma att experimentmaterialet skulle användas i verkliga scenarion. Stricker svarade att forskningsresultaten från AVASAG-projektet, vilket Charamel initierade och där yomma, tillsammans med andra partners, deltog, skulle kunna användas av vem som helst.
Sammanfattning och framåtblick: Vad händer härnäst?
Man behöver bara titta på framstegen sedan AI-genererade videor först introducerades 2023 fram till 2024 års Sora AI-videogenerering för att se hur snabbt tekniken har utvecklats. Textöversättningar som DeepL har också blivit mycket pålitliga tack vare AI:s framsteg. Det är inte omöjligt att se AI användas för att förbättra automatiserad teckenspråkstolkning genom avatarer, även om de flesta verkar skeptiska, och den ”uncanny valley”-effekt som många förknippar med teckenspråksavatarer är något som måste beaktas.
Sedan Memoji-”avatarerna” lanserades med Apples iPhone X, har det blivit tydligt att rörelsespårning utan fullständiga motion capture-dräkter och specialteknik är möjlig för vanliga användare. Det kaliforniska företagets senaste introduktion av ”personas”, som i grunden är individuellt designade avatarer för videosamtal med nya Vision Pro-headsetet, visar att det är möjligt att exakt efterlikna rörelser och handformer och nästan kringgå ”uncanny valley”-effekten.
Om man bortser från tolkningsaspekten, finns det andra användningsområden för denna teknik, som visas i RWTH Aachens forskning om anonymisering genom teckenspråksavatarer. Anonymt teckenspråk är nästintill omöjligt, men avatarer – eller anpassningsbara ”personas”, som Apple kallar det – skulle kunna tillföra en nivå av sekretess eller neutralitet för teckenspråkspresentatörer. Men eftersom avatarer oftast drivs av kostnadsbesparingssyfte är det osannolikt att detta kommer få finansiering och genomslag. Som det österrikiska förbundet Verbal uttryckte det, kan mänskliga rättigheter inte vägas i pengar – detta borde vara den huvudsakliga slutsatsen av frågan kring avatarer, och man kan se hur mycket pengar det finns att tjäna på att erbjuda ”tolkningstjänster” till en betydligt lägre kostnad.
De Meulder ser en särskild utmaning för döva forskare. Å ena sidan tvingas de visa sin bästa sida i samarbete med hörande forskare och brottas med makt- och kommunikationsobalanser: “Många döva forskare har upplevt att de blir tillfrågade att samarbeta kring AI-projekt för teckenspråk ofta långt efter att idén formulerats, teamet byggts, forskningen genomförts eller till och med när projektet nästan är färdigt. Detta skapar ofta en ond cirkel för döva forskare, då teknologin kommer utvecklas och forskningen publiceras oavsett vår inblandning, medan medverkan kan innebära ett godkännande.”
De Meulder nämner för närvarande 10 forskningsprojekt sedan 2015, alla finansierade av EU med nästan 26 miljoner euro. Liksom de flesta teknologier drivs utvecklingen av ekonomiska motiv: “Det är inget undantag för teknologier för teckenspråk, även om de ekonomiska incitamenten kan skilja sig på grund av marknadens mindre storlek. Men de är fortfarande framträdande, och handlar inte bara om att generera vinst utan även om att sänka kostnader.” Hon ser detta inte nödvändigtvis som i motsats till mänskliga rättigheter och tillgänglighet, utan snarare bör man överväga hur man kan “utnyttja dessa teknologier för att förbättra tillgängligheten för döva, och inte bara väga dem mot sina ekonomiska incitament.”
Diskussionen kring de etiska aspekterna av teckenspråksavatarer fortsätter. Den största risken för dövsamhället ligger i risken att kompromettera teckenspråkets och dövkulturens integritet. Teckenspråksavatarer kan potentiellt försämra teckenspråkets kvalitet och äkthet, göra det konstgjort eller eliminera viktiga kulturella och sociolingvistiska aspekter. Dessutom finns det farhågor om den kommersiella användningen av denna teknik, som kan drivas av ekonomiska intressen snarare än etiska och sociala överväganden för att förbättra tillgängligheten för dövsamhället. I slutändan, om teckenspråksavatarer inte utvecklas på ett ansvarsfullt sätt, med meningsfullt deltagande av dövsamhället och särskild hänsyn till att bevara teckenspråk och dövkultur, kan de potentiellt göra mer skada än nytta.