Mer om AI #3 – Visuell AI
De senaste veckorna har handlat mycket om datorseende (computer vision) eller visuell AI (vision AI, visual AI). Visuell AI har många användningsområden och innebär att vi (maskinen) använder kamerasensorer, bilder och videoströmmar för att utföra en specifik uppgift. Idag är visuell AI redan en viktig beståndsdel i bland annat autonoma robotar, ansiktsigenkänning, övervakningssystem, bildmoderering, stöd för medicinska diagnoser, och förarassistanssystem i bilar.
Som ofta inom områden med hög utvecklingstakt är definitionerna en aning flytande. Andra benämningar på visuell AI som florerar är bland annat maskinseende (machine vision) och visuell intelligens (visual intelligence). Min uppfattning är att begreppen till stora delar överlappar varandra. Visuell AI kan många gånger fungera i kombination med både andra sensorer, data och funktioner. I försöken med självkörande bilar använder Tesla exempelvis lidar (ljusradar) tillsammans med visuell AI.
Andra områden där visuell AI blir allt mer betydande är omvänd bildsökning och marknadsföring. Genom att analysera bilder kan artificiell intelligens både identifiera innehåll och generera nya individuellt anpassade bilder. Virtuella provrum är exempelvis en tillämpning som blivit allt mer aktuell nu under Covid-pandemin.
Visuell AI används även i jordbruk för att både analysera olika situationer med hjälp av drönar- eller satellitbilder och låta robotar arbeta mer precist. Genom att identifiera ogräs och skadeinsekter visuellt kan användningen av bekämpningsmedel styras mer precist och den totala mängden minskas avsevärt.
En seende maskin klarar mer
Vi kan tänka oss att den fortsatta automatiseringsvågen till stor del kommer att involvera olika former av visuell AI. I många fall är världen relativt oförutsägbar, föränderlig, svårbedömd och full av avvikelser. Här har tidigare automatisering haft begränsad framgång eftersom den i första hand byggt på förprogrammerad kunskap i en stabil och förutsägbar miljö.
Med hjälp av sensorer och visuell AI kan nya nivåer av automatisering uppnås genom att maskinen löpande kan anpassa sig till de aktuella förutsättningarna. Tack vare att den kontinuerligt kan tolka och uppdatera sin kännedom om världen kan den också utföra uppgifter som tidigare krävde mänsklig förmåga. Att skörda känsliga frukter och bär, anpassa sig till livliga trafikanter, och bedöma riskbeteenden i realtid är idag möjligt med visuell AI.
Ditt ansikte är du
En stor fråga är naturligtvis hur alla bilder behandlas av de företag och myndigheter som använder sig av visuell AI. Speciellt i de situationer där personuppgifter i form av ansikten förekommer. Vi har redan sett många exempel på algoritmer som är snedvridna och gör felaktiga bedömningar med ansiktsigenkänning. Viktiga etiska och juridiska ställningstagande behöver göras med utgångspunkt i en utvecklad demokratisk samhällsmodell. I synnerhet när mängden kameror och övervakning ökar dramatiskt. Som medborgare, användare och konsumenter ska vi kunna lita på att våra uppgifter och ansikten inte missbrukas.
Ur ett kommersiellt perspektiv behövs också ett tydligt ramverk så att många av de positiva möjligheter som artificiell intelligens innebär kan omvandlas till attraktiva tjänster. Efter många påtryckningar bestämde sig Amazon i somras för att skjuta upp försäljningen av ansiktsigenkänning till den amerikanska polisen i ett år. En bakomliggande orsak var just att reglering kring tekniken i stort saknas. Tillsammans med snedvridna algoritmer, med betydligt sämre precision för mörkhyade än ljusa, uppfattas det av många som en explosiv kombination och öppnar för missbruk. Strax innan hade IBM meddelat att de lämnar affärssegmentet helt med hänvisning till risken för rasprofilering.
Samtidigt som potentialen är väldigt stor ser vi att det finns svåra frågeställningar som följer med visuell AI. Eftersom AI successivt bidrar till allt mer avancerade och sammankopplade system måste juridik och etik uppdateras i samma takt. Offentliga organisationer och företag behöver veta hur de ska kunna leva upp till våra förväntningar på integritet och säkerhet. Och vi behöver kunna vara säkra på att de agerar som de utlovat.
Här är några exempel på tillämpningar med visuell AI för ansiktsigenkänning:
- Smile to pay: Chinese shoppers turn to facial payment technology (The Guardian)
- Podcast: Facial recognition is quietly being used to control access to housing and social services (MIT Technology review)
- Microsoft patents tech to score meetings using body language, facial expressions, other data (GeekWire)
- Kamua’s AI-powered editor helps marketers embrace vertical video (VentureBeat)
- Why Hong Kong protesters fear the city’s ‘smart lamp posts’ (Financial Times)
- Face recognition isn’t just for humans — it’s learning to identify bears and cows, too (CNN)
Samt tre mer experimentella: