Nyhedsbreve

Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer

Streetscapes genererer realistiske videoer trin for trin ud fra gadekort, højdekort over bygninger og ønskede kamerabevægelser gennem den virtuelle by

René Hjetting

23 jul 2024 — 8 min read

Lavet med Midjourney

Godmorgen 🤗

Det er helt utroligt, at forskere fra Stanford University og Google har udviklet et AI-system kaldet "Streetscapes", som kan generere realistiske gadevisninger af hele byer.

Udviklingen inden for AI går hurtigt, og snart kan AI-agenter arbejde sammen og løse opgaver i et såkaldt multi-agent AI-system. Dette forventes at blive en realitet allerede i 2025.

God læselyst med nyhedsbrevet!
/René 🤗

Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer
Kunstig intelligens-agenter, der kan samarbejde, forventes i 2025
Ny DeepL-model slår ChatGPT-4 og Google Translate i blindtest
OpenAI lancerer ny sikkerhedsmetode til ChatGPT for at forhindre misbrug
Google lancerer AI-drevet app til nemme videopræsentationer

💡

Ugens AI-værktøj: Microsoft lancerer AI-drevet Designer-app til iOS og Android

Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer

Forskere fra Stanford University og Google har udviklet et AI-system kaldet "Streetscapes", som kan generere realistiske gadevisninger af hele byer.

Systemet er baseret på diffusionsmodeller og er trænet på millioner af billeder fra Google Street View.

Streetscapes genererer realistiske videoer trin for trin ud fra gadekort, højdekort over bygninger og ønskede kamerabevægelser gennem den virtuelle by. En "Motion Module" og en ny teknik kaldet "Temporal Imputation" sikrer bevægelse og tidsmæssig konsistens mellem de enkelte billeder.

Systemet kan generere op til 100 billeder med kamerabevægelser på over 170 meter, hvilket muliggør kreative anvendelser som at styre byens udseende gennem tekstbeskrivelser. Forskerne planlægger at forbedre kontrollen over bevægelige objekter og billedkonsistens yderligere.

Streetscapes ses som et vigtigt skridt mod AI-systemer, der realistisk kan generere ikke blot individuelle objekter, men hele, ubegrænsede scener. Eksempler inkluderer at visualisere parisiske gader i New Yorks stil eller at ændre tidspunkt på dagen og vejrforhold i de genererede byer.

Kunstig intelligens-agenter, der kan samarbejde, forventes i 2025

Ifølge teknologiservice-giganten Capgemini forventes det, at kunstig intelligens-drevne agenter, der kan arbejde sammen og løse opgaver i et såkaldt multi-agent AI-system, vil være en realitet i 2025.

Dette system vil omfatte en samling af agenter, der samarbejder om at løse opgaver på en distribueret og kollaborativ måde.

Pascal Brier, Capgeminis innovationschef, fortæller til CNBC, at virksomheden allerede ser selskaber, der diskuterer disse agent-teknologier. Han tilføjer, at applikationer, der bruger flere autonome agenter, virkelig er det, vi kan forvente i det kommende år.

En ny forskningsrapport fra Capgemini viser, at størstedelen af de adspurgte virksomheder (82%) planlægger at integrere AI-agenter inden for en til tre år. Disse agenter falder i to typer: individuelle agenter, der udfører opgaver på dine vegne, og multi-agent-teknologi, hvor agenter taler med agenter.

Ny DeepL-model slår ChatGPT-4 og Google Translate i blindtest

Det tyske AI-firma DeepL har lanceret en ny specialiseret sprogmodel til oversættelse og redigering af tekst. Ifølge DeepL sætter denne opdatering en ny industristandard for oversættelseskvalitet.

Den nye model kombinerer tre nøglefunktioner: En specialiseret sprogmodel optimeret til sprogopgaver, træning på over syv års proprietær data fokuseret på tekstproduktion og oversættelse, samt input fra tusindvis af nøje udvalgte sprogeksperter.

Blinde test med sprogeksperter viser ifølge DeepL, at deres oversættelser foretrækkes 1,3 gange oftere end Google Translate, 1,7 gange oftere end ChatGPT-4 og 2,3 gange oftere end Microsofts løsning. Virksomheden rapporterer særlige forbedringer i oversættelser fra engelsk til japansk og forenklet kinesisk.

DeepLs administrerende direktør Jarek Kutylowski kalder lanceringen "kun begyndelsen" på virksomhedens AI-drevne sprogløsninger til virksomheder. Den nye model er tilgængelig for DeepL Pro-kunder til oversættelser mellem engelsk, japansk, tysk og forenklet kinesisk, med planer om flere sprog.

DeepL Translate: The world’s most accurate translator

Translate texts & full document files instantly. Accurate translations for individuals and Teams. Millions translate with DeepL every day.

DeepL

OpenAI lancerer ny sikkerhedsmetode til ChatGPT for at forhindre misbrug

OpenAI, firmaet bag den populære AI-chatbot ChatGPT, har udviklet en ny sikkerhedsmetode kaldet "instruktionshierarki" til deres seneste model, GPT-4o Mini.

Denne metode har til formål at forhindre brugere i at omgå chatbottens oprindelige instruktioner ved at bruge tricks som "ignorer alle tidligere instruktioner".

Med instruktionshierarkiet vil GPT-4o Mini prioritere de oprindelige instruktioner, som udviklerne har givet, fremfor brugerens forsøg på at ændre dem. Hvis en bruger forsøger at give chatbotten en instruktion, der er i strid med de oprindelige retningslinjer, vil GPT-4o Mini simpelthen svare, at den ikke kan hjælpe med forespørgslen.

Denne nye sikkerhedsmekanisme er et skridt i retning af OpenAIs mål om at skabe fuldautomatiserede agenter, der kan hjælpe med at styre brugernes digitale liv.

Uden denne beskyttelse kunne en agent, der er bygget til at skrive e-mails, blive manipuleret til at glemme alle instruktioner og sende indholdet af en brugers indbakke til en tredjepart.

Google lancerer AI-drevet app til nemme videopræsentationer

Google lancerer en ny produktivitets-app kaldet Vids i Workspace Labs. Vids gør det muligt at lave en videopræsentation lige så nemt som at lave en slide til en præsentation.

Med Vids kan brugere tilføje dokumenter, slides, voice-overs og videooptagelser på en tidslinje for at skabe en præsentationsvideo, der kan deles med kolleger.

Det centrale ved Vids er den AI-drevne assistent Gemini. Ved at beskrive hvad man ønsker, kan Gemini automatisk indsætte stock footage, generere et manuskript og endda tilføje en AI-genereret voice-over til præsentationen, uden at brugeren selv behøver at sige et ord.

Vids skal ikke forveksles med AI-værktøjer som OpenAIs Sora, der kan skabe realistiske optagelser ud fra en prompt. I stedet handler Vids om at generere en præsentation ved hjælp af Gemini og derefter lade brugeren tilpasse videoen efterfølgende.

Microsoft lancerer AI-drevet Designer-app til iOS og Android

Microsoft lancerer i dag deres AI-drevne app Designer til iOS og Android efter at have været i preview i næsten et år.

Designer giver brugerne mulighed for at bruge skabeloner til at lave tilpassede billeder, klistermærker, lykønskningskort, invitationer og meget mere.

Appen kan også bruge kunstig intelligens til at redigere billeder, ændre deres stil eller lave collager. Designer indeholder en række skabeloner til forskellige formål, såsom sociale medier, ikoner, baggrunde og malebøger. Der er også en avatar-funktion i den mobile version.

Derudover kan man bruge Designer til at redigere billeder med AI, fjerne baggrunde, fjerne personer eller objekter fra billeder samt tilføje tekst og branding. Designer integreres også i Microsofts andre apps som Word og PowerPoint, så Copilot Pro-abonnenter kan lave billeder og designs direkte deri.

Tak for at du læste med!

Jeg glæder mig til at dele flere spændende AI-nyheder med dig i næste uges nyhedsbrev. Har du tanker, spørgsmål eller bare lyst til at dele din mening? Skriv endelig tilbage - jeg elsker at høre fra mine læsere og svarer altid personligt.

Kender du andre, der er nysgerrige på AI's muligheder? Del gerne nyhedsbrevet med dem - sammen bliver vi klogere! 🤗

Vi ses på tirsdag!

Mvh. René Hjetting
Mobil: +45 29 27 65 40

Klar til at tage det næste skridt med AI?

Jeg står klar til at hjælpe dig og din, virksomhed, organisation eller netværk med at forstå og implementere kunstig intelligens på en måde, der skaber ægte værdi i hverdagen.

Lad os tale sammen, kontakt mig på:

Mobil: 29 27 65 40 eller skriv til mig her

Services

– Foredrag: Inspirerende og handlingsorienterede præsentationer om AI
– Undervisning: Dybdegående workshops og kursusforløb
– Rådgivning: Strategisk sparring om implementering af AI i jeres organisation

Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer

René Hjetting

Her er dagens menu:

Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer

Kunstig intelligens-agenter, der kan samarbejde, forventes i 2025

Ny DeepL-model slår ChatGPT-4 og Google Translate i blindtest

OpenAI lancerer ny sikkerhedsmetode til ChatGPT for at forhindre misbrug

Google lancerer AI-drevet app til nemme videopræsentationer

Microsoft lancerer AI-drevet Designer-app til iOS og Android

Klar til at tage det næste skridt med AI?

Lad os tale sammen, kontakt mig på:

Services

Read more

Copilot tager kampen op mod ChatGPT med nye smarte funktioner

Fra bogtryk til kunstig intelligens: Sådan forandrer teknologi vores viden

Disney får hjælp fra tech-giganter til nye robotoplevelser

Din Big Mac laves nu med hjælp fra kunstig intelligens

Her er dagens menu:

Forskere skaber AI, der kan generere realistiske gadebilleder af hele byer

Kunstig intelligens-agenter, der kan samarbejde, forventes i 2025

Ny DeepL-model slår ChatGPT-4 og Google Translate i blindtest

OpenAI lancerer ny sikkerhedsmetode til ChatGPT for at forhindre misbrug

Google lancerer AI-drevet app til nemme videopræsentationer

Microsoft lancerer AI-drevet Designer-app til iOS og Android

Klar til at tage det næste skridt med AI?

Lad os tale sammen, kontakt mig på:

Services

3 minutter

Read more

Copilot tager kampen op mod ChatGPT med nye smarte funktioner

Fra bogtryk til kunstig intelligens: Sådan forandrer teknologi vores viden

Disney får hjælp fra tech-giganter til nye robotoplevelser

Din Big Mac laves nu med hjælp fra kunstig intelligens