United Robots satt i sammanhang:
Varför det vi gör är unikt

På United Robots ser vi oss själva som ett tjänsteföretag inom automatiserat innehåll. Vi designar, bygger och stöder hela det förlopp som krävs för att få till en kontinuerlig process. Att sätta upp en sådan process består av flera steg, inklusive dataintegration, dataanalys, textdesign, mallar, innehållsgenerering, innehållsanalys och integration av innehåll med kundens CMS, regelbunden förbättring av verktyg, support med mera.

Wordsmith från Automated Insights är kanske det mest välkända programmet som gör det möjligt för vem som helst att automatisera innehåll från strukturerad data. Att skriva mallar som förvandlar data från ett excel-ark till textsnuttar är relativt okomplicerat för en person med hyfsad teknisk kunskap. Att bygga mer avancerad text blir snabbt väldigt komplicerat och känns mer som att programmera än att skriva text. Man tvingas skapa flera verktyg och system ovanpå Wordsmith för att få önskat resultat.

United Robots har ett verktyg som motsvarar Wordsmith’s för att skapa och hantera textmallar, men det finns så många fler aspekter på att bygga lösningar för automatiskt innehåll än själva skrivverktyget. Det är bara en länk i kedjan. Vi har sammanställt några av de övriga nedan:

  1. Dataanalys. United Robots är experter på att analysera data för att skapa nyhetsmässigt innehåll. Vi arbetar med flera källor för att bygga våra insikter. Ta till exempel när vi skapar artiklar om fastighetsförsäljningar. Vi använder då rådatan från Lantmäteriet och kör den ihop med data från två olika geografiska databaser för att kunna bygga insikter som "För två veckor sedan såldes en annan fastighet på samma gata för halva priset” eller “Detta är de 10 dyraste fastigheterna på dessa tre strandgator som sålts i år.” Dessutom använder vi Google street view i kombination med bildanalys för att automatiskt koppla en relevant bild till varje fastighetstext. Om vi skulle använda default-bilden som Google street view ger oss för en given adress kan det hända att vi får en bild som består av 90% träd och bara en liten bit hus. Istället “rör” vi oss fram och tillbaka längs fastigheten i Google street view för att hitta en bättre bild där själva huset syns i bild. Vi jobbar nu också på att kunna ta hänsyn till höjdskillnader på tomten för att hitta bästa möjliga bild.

    Vår analyserade data från Lantmäteriet, geodatat och bilden används sedan som input för textroboten. Detta är oftare en större utmaning än att bygga mallar i robotens textverktyg. Ju bättre insikter vi kan bygga, desto mer nyhetsvärdiga blir texterna som genereras.

  2. Avancerade textmallar. Vi tror att vi har marknadens mest funktionsrika mallverktyg. När vi skriver en text kan vi t ex ta ställning till huruvida någonting redan nämnts i ett tidigare textstycke. Om vi t ex skrivit att John Doe gjorde tio mål i matchen, ser vi till att inte upprepa detta faktum i påföljande textstycken.
    Ett annat exempel är när vi skriver om ett givet lags form: I brödtexten har vi definierat att vi vill att ett textstycke handlar om hemmalag A’s form, och att fortsätta skriva intressanta fakta som inte redan nämnt till dess att det inte finns något kvar att skriva om. När vi därefter skriver vi om bortalag B’s form, ser vi till att inte nämna något som redan varit med i lag A’s formstycke. Om t ex lag A har vunnit de senaste 3 matcherna mot lag B, skriver vi inte att lag B har förlorat de senaste tre matcherna mot lag A.

    Det är inte i skrivverktyget som vi försöker skapa konkurrensfördelar gentemot t ex Wordsmith. Vi säljer för närvarande inte ett gör-det-själv verktyg, även som vi skulle kunna göra det. Vi arbetar tillsammans med mediehus för att designa och integrera det automatiska innehållet i deras CMS och processer. När vi skapar en ny typ av text, som t ex en exporthandelsrapport, jobbar våra ingenjörer med journalister från mediehuset för att sätta upp allting. Journalisterna skapar ett par exempeltexter som ingenjörerna sedan bygger dataanalys och textmallar för att stödja. Alla textstycken som skapats i skrivverktyget av ingenjörerna kan läsas och redigeras av journalisterna. Att skapa allting från start kan vara en rejäl utmaning, som bäst passar en mjukvaru-utvecklare, men när roboten är igång är det relativt okomplicerat för journalisterna att göra enkla ändringar.

  3. Funktioner för medieföretag. United Robots har lång erfarenhet av att leverera automatiserat innehåll till medieföretag. Förutom att analysera data och designa textmallar, erbjuder vi ett antal funktioner specifikt tänkta för medieföretag. När vi skriver sport, t ex, producerar vi en version från hemmalagets synvinkel, en från motståndarnas synvinkel och en med ett neutralt perspektiv. Alla tidningar lägger in vilka lag de har fokus på i alla ligor de täcker, och får rätt version tillskickat sig. Ett annat exempel är att när vi skriver om ungdomssport så använder vi inte samma “hårda” språk som vi gör för professionell sport. Om det ena laget i en fotbollsmatch för 12-åriga flickor t ex besegrar det andra med 30-0, skriver vi inte att lag A fullständigt krossade lag B, utan något mer allmänt typ “en match spelades, resultatet blev 30-0 och alla hade roligt.”

    Vi är mycket flexibla i integrationen med mottagarens content management system, vad gäller att följa den taggning och kategorisering som krävs för att våra texter ska läggas i rätt bucket.
    Vi övervakar också mottagarsystemet och kan pinga mediehusets tekniker om det verkar som om ert system har svårt att läsa det innehåll vi sänder.

    Vi kan flagga nyhetsdesken kring det statistiskt mest intressanta innehållet, på ett antal sätt, e g via Slack, sms, email eller webbsida. Dessa flaggningar kan t ex handla om att en husförsäljning till rekordpris ägt rum, eller att lag A kommer att vinna ligan om de vinner kvällens match, eller att person X gjorde 15 mål in en match i de lägre serierna. Vi har många exempel där journalister har skrivit mycket vällästa artiklar utifrån flaggningar på stories som annars skulle missats av nyhetsdesken.

    Vi kan t ex producera exportfiler från Indesign med den mark-up tidningen behöver för att göra layouten av innehållet för den tryckta upplagan mer effektiv.

    Vi kan hantera olika publiceringstider för olika typer av innehåll samt även se till att texterna uppdateras så fort ny data blir tillgänglig. Vi kommer för all framtid ihåg hur samtliga texter skrivits, och så länge det nya datat inte förändrar den huvudvinkel för artikeln som tidigare genererats, lägger vi bara till eller ändrar den nya texten in i den existerande. Man vet t ex oftast inte hur tabellen kommer att se ut förrän alla matcher i en omgång spelats.

  4. Skalbar infrastruktur. Vår tekniska infrastruktur bygger på en serverfri och helt molnbaserad arkitektur, vilket möjliggör obegränsad parallellitet och mycket kostnadseffektiva processer. En typiskt text tar ungefär en sekund att generera och vi är helt linjära när vi skalar upp processen. Om vi gör 100 texter samtidigt, blir de alla färdiga efter en och samma sekund. Och eftersom själva textgenereringen är så kostnadseffektiv kan vi i princip skapa texter i realtid. Våra partners kan återskapa sina texter så ofta de önskar. En nyckelfunktion är att det ska vara möjligt att generera texter som är unika för enskilda läsare, på ett kostnadseffektivt sätt. För att verkligen personalisera ditt innehåll måste du automatisera produktionen. Och för att lyckas med det är det viktigt att systemet är skalbart vad gäller hastighet och volym.

  5. Vi säljer en tjänst, inte ett verktyg. Vi tillhandahåller en tjänst där vi tar ansvar för att arbeta tillsammans med våra partners för att kontinuerligt förbättra det automatiska innehållsflöde som skapats. Vi analyserar i efterhand de genererade texterna vad gäller korrekthet och variation, samt använder feedback från våra partners för att prioritera vilka områden vi bör fokusera på i nästa utvecklingsfas.