Digin er Norges ledende IKT-klynge med over 130 medlemsbedrifter innen IT, digitalisering og teknologi. Målet er å styrke Agder som et nasjonalt ledende miljø for teknologisk utvikling, og samtidig gjøre regionen til et attraktivt sted for etablering av nye bedrifter og investeringer. Dette oppnås gjennom å fremme innovasjon, legge til rette for kompetanseutvikling og bidra til synlighet for medlemmer og arrangementer.
De første oppgavene i prosjektet mitt har gått ut på å kartlegge medlemsbedrifter, finne RSS-feeds, relevante nettsider, relevante søkeord og få innhenting av artikler til å fungere.
Et av de store problemene hittil har vært å finne ut hvordan informasjon skal hentes ut fra skrapede artikler. Dette er fordi det er forskjellig fra side til side hvordan informasjonen er lagt opp. Feks tittel, dato og beskrivelse er kodet inn i html på forskjellige måter. Dette gjør at det må gjøres mange sjekker for å kunne hente ut dette fra forskjellige nettsider.
Forside som viser hvordan søket oppsummeres når det er gjennomført
Hvordan treff på henholdsvis RSS og webscraper ser ut i programmet
Videre plan fremover vil er å forbredre innhenting ytterligere samt implementere api-kall til openAI som kan lese artikler og deretter lage oppsummeringer. Dette skal også hjelpe med å filtrere på relevansen i artiklene.