Railway Metrics and Dynamics arbetar med att digitalisera järnvägen genom att utveckla AI och Machine Learning-baserade sensorer som arbetar tillsammans i ett ”system av system”. Men hur fungerar egentligen Machine Learning-tekniken – och vad är det som gör RMD:s system och produkter så unika?
Så här säger RMD:s AI- och Machine Learning-expert Bonny Wong.
I Railway Metrics and Dynamics nya lokaler på Övre Gärdet inreds vårt nya, utökade Machine Learning Lab. Här samlas all data från våra kunders sensorer som används i trafik – inte bara i Sverige, utan över hela världen. Här står också våra egna kraftfulla servrar där vi kan köra förfinade simuleringsmodeller på världsledande licensierad programvara.
Om AI och Machine Learning
Machine Learning och AI är två nära besläktade områden som handlar om att skapa system och algoritmer som lär sig från data och sedan utföra uppgifter som normalt sett kräver mänsklig intelligens.
Machine Learning är en delmängd av AI som fokuserar på att ge datorer möjligheten att lära sig utifrån data – utan att programmeras för varje uppgift. Man arbetar istället med algoritmer och modeller, som tränas på mycket stora datamängder för att kunna hitta mönster och göra förutsägelser. De har förmågan att förbättra sin prestanda över tid, baserat på erfarenheter.
AI är alltså ett bredare koncept som handlar om att skapa intelligenta system som kan resonera och fatta beslut. Machine Learning är en teknik som används för att utveckla dessa intelligenta system genom att låta dem lära sig av data.
Varför är det viktigt med en stor datamängd?
– Machine Learning-modeller lär sig genom att analysera stora datamängder och identifiera mönster. Om datamängden är för liten, för dålig eller inte representativ, uppstår problem med själva träningen. Det här är speciellt viktigt i nischade branscher, till exempel just järnvägsbranschen. Antingen kan modellen bli övertränad – dvs den har anpassats för mycket – eller så kan den bli undertränad, så att den har dålig prestanda.
– Det handlar om generaliseringsförmåga. Ju mer diversifierad och omfattande datamängden är, desto bättre kan modellen generalisera i nya, okända situationer. Om datamängden innehåller fel eller inte är tillräckligt bred, så kan inte modellen inte fatta rätt beslut – eftersom den helt enkelt inte känner till alla fakta. Modellen fungerar helt enkelt dåligt i verkliga situationer.
– Det finns alltså två grundläggande krav som måste infrias. Datamängden måste vara korrekt, och den måste vara omfattande.
Varifrån kommer RMD:s data?
– För en nischad bransch som järnvägen är den data man vill komma åt mycket sällsynt.
Det som är unikt med Railway Metrics and Dynamics är att vi samlar in vår egen data.
De sensorer vi levererat till våra kunder både i Sverige och övriga världen genererar kontinuerligt data som lagras hos oss på RMD.
– I ett av våra projekt har vi sedan 2022 samlat in data från ett MB-lok där våra PMU-sensorer sitter installerade. Fordonet används i trafik över i stort sett hela Sverige, och speciellt på sträckan Falun-Gävle. Varje mätning som tåget gör på sin resa genererar ungefär 1 500 mätpunkter per sekund – och per sensor. Sedan projektet startade har vi samlat in många hundratals gigabyte datapunkter.
– Våra PMU-sensor är unika eftersom de mäter kontinuerligt utan avbrott. De sänder information non-stop. Tillsammans levererar de en enorm mängd data från verkligheten – av en sort som ingen annan förfogar över.
– RMD:s modeller och algoritmer baseras alltså på en enorm datamängd som både är kvalitetssäkrad och specifik för järnvägsbranschen, vilket är helt unikt.
Hur kvalitetssäkrar man datan?
– Innan datan kan användas i en maskininlärningsmodell, eller för analyser och rapporter, måste den förfinas. RMD lägger mycket tid på att just sortera och filtrera ut rätt information.
– Det finns många sätt att få bort ”brus”. Hastighet är en parameter man kan titta på, eftersom långsamtgående tåg ofta levererar mindre relevant data. Spårväxlar genererar ofta mycket gungningar och skakningar. Plankorsningar och andra fasta objekt kan också sållas bort. Och vi vet var alla dessa objekt befinner sig tack vare Trafikverkets öppna datakällor.
– Med hjälp av bakgrundsinformationen och vår egen järnvägskompetens ser vi till att den data vi använder är så ren som den kan bli.
”Våra simuleringar är ett viktigt verktyg”
– Utöver vår enorma mängd data från verkligheten, skaffar vi oss ett ännu större underlag genom att köra simuleringar. Men innan en simulering kan dra igång måste man göra ett visst uppstartsarbete, bland annat modelleras det specifika fordonet som ska köras. När simulationen använder vi datan som kommer ut för att utveckla våra algoritmer, våra analysalgoritmer och maskininlärningsmodellerna. För att förfina det hela ytterligare, kan vi mata in riktig mätdata för att se hur simulationen beter sig.
–På så sätt kalibrerar vi simulationen, tills utkomsten av den exakt stämmer överens med verkligheten.
– Sedan kan vi ”skruva på knapparna” genom att mata in olika parametrar. Det kan exempelvis vara fel på spåret, tågets sammansättning, lastens vikt, lokets skick, hastigheten och en mängd andra variabler. Genom tillverkarna vet vi på förhand vad vagnarna och loket väger, vilken typ av fjädring som används eller hur en viss bogietyp fungerar.
– För att kunna simulera ett fordon behöver en simulering kalibreras under några dagar. Sedan kan vi köra ett tåg i den virtuella världen och på så vis generera stora mängder simulerad data. Även den här typen av data mycket ovanlig och existerar nästan bara inom forskningsvärlden.
– Simuleringar kommer aldrig att vara 100% korrekta, men de är ett otroligt viktigt kompletterande verktyg när RMD utvecklar algoritmer och modeller.
”Effektiv utveckling kräver en bredd av kompetenser”
– RMD:s sätt att utveckla system och produkter baserade på AI och Machine Learning pushar tekniken framåt. Vi följer noggrant den forskning som bedrivs just nu – idag, och vi är snabba på att testa teorier och bygga modeller på nya sätt.
– Idag pratar man ofta om enbart om själva utvecklingen av nya modeller, som Foundation-modeller eller att använda Transformer-modeller (ChatGPT) för nya ändamål eller för att upptäcka avvikelser. Men sedan ska dessa modeller också integreras i verksamheten, och det kräver väldigt mycket kunskap för att förstå hur man införlivar en ny datamodell i flöden som redan existerar.
– RMD:s Machine Learning Lab består av en bredd av kompetenser inom allt från hårdvarubyggande till AI-expertis. Vi implementerar den forskningen som sker just nu – man kan säga att utvecklingen sker i realtid. Flera av våra anställda på vårt Machine Learning Lab har också mycket lång erfarenhet av järnvägen, vilket ger RMD en unik position.
Varför är det viktigt att ständigt utvecklas?
– Med RMD:s teknik är det ganska enkelt att detektera uppenbara fel: urspårningar, hjulplattor, spårfel eller en mängd andra olika gångdynamiska avvikelser. Våra sensorer kan upptäcka i stort sett allt som kan gå fel både vad gäller lok och vagnar, men också fel som uppstår på infrastrukturen. Det är till och med möjligt att inkludera andra typer av yttre påverkan, exempelvis nederbördsmängder som kan påverka ballasten under spåren och mäta eventuell degradering över tid och korrelera detta till sådan data.
– Nästa steg i utvecklingen för RMD är att urskilja detaljer i felen. Vi vill kunna hitta dess exakta utformning och orsak. Det här är möjligt med stora mängder data och många simuleringar. Och eftersom vi har just sådan data har vi redan börjat – bland annat med ett test med en Foundation-modell här på RMD:s Machine Learning Lab.
– Den accelerometerdata våra PMU-sensorer levererar kan ibland innehålla anomalier som orsakas av fel i kontaktledningen. Vi använde vår Foundation-modell för att hitta just sådana här avvikelser. Tack vare att PMU:erna sänder data kontinuerligt, bland annat GPS-data, kunde modellen tala om för oss exakt var någonstans på en sträcka som det finns brister på kontaktledningen. Det gick förvånansvärt bra!
– Och det här öppnar upp en rad möjligheter. En sådan Machine Learning-modell kan vi metodiskt träna upp att förutse vad som kommer att inträffa längre fram i tiden. Vi kan verifiera detta genom att köra två olika simuleringar parallellt – en med anomalier och en utan, för att sedan jämföra resultaten och träna modellen på skillnaderna.
– Idag analyserar vi vår data med hjälp av matematiska modeller som man antagit har vissa egenskaper. Med en Foundation-AI kan vi verifiera att de antagandena är korrekta, eller få insikter om att det existerar tillstånd som vi inte kunnat förutse. Vi använde alltså modellen i syfte att hitta anomalier.
Vad är RMD:s styrka?
– Vi arbetar med det allra senaste inom Machine Learning, och vi flyttar gränserna varje dag. Vi jobbar brett med analyser, algoritmer och vanliga Machine Learning-metoder. Vi använder alla tekniker som står till förfogande – och när det forskas kring något nytt, snappar vi upp det och testar vi de nya metoderna genast.
– Vår styrka är att vi är flexibla. Vårt Machine Learning Lab är en kreativ plats, och det finns ingen särskild hierarki mellan de olika kompetenserna som arbetar där. Ibland svävar vi ut, men det är också en naturlig del av utveckling när man bedriver den på riktigt. Hos oss utvecklas nya produkter i takt med att tekniken mognar och är redo.
– En sådan miljö som skapats här är lika viktig som kompetensen.