AI-bildgeneratorn Midjourney expanderar med nya funktioner och planerar för framtiden

» Håll dig ajour kring AI · En AI-skapad och ständigt föränderlig nyhetstidning om AI. Idag har vår robot sammanfattat 253 nyhetshändelser. Upptäck gärna vår kurs AI på jobbet förresten. «

AI-bildgeneratorn Midjourney expanderar med nya funktioner och planerar för framtiden

Midjourney är ett ord som blivit synonymt med AI-bilder. Det var en av de första högprofilerade generativa artificiella intelligensmodellerna vars resultat blev viralt på sociala medier. Företaget grundades tidigt 2022 av entreprenören David Holz som började med att efterfråga högkvalitativa fotografier på Twitter och Reddit för att träna den nya modellen. Sedan dess har Midjourney integrerats med Discord, där användare kan generera bilder med hjälp av en bot. Företaget började i december 2021 erbjuda begränsad tillgång till ett webbgränssnitt för att skapa bilder. Nu arbetar utvecklarna på en sjätte version av sin bildgenereringsmodell, och planerar att utveckla 3D- och videolägen för att skapa en fullständigt uppslukande virtuell miljö. Midjourney är en av de mest använda och dominerande AI-bildgeneratorerna på marknaden, känd för sin realism och förmåga att skapa övertygande produktbilder. Från och med version sex av sin underliggande modell kan Midjourney nu rendera läsbar text på de bilder den skapar, vilket öppnar upp nya möjligheter för marknadsföring och reklam. Till skillnad från många andra AI-verktyg har Midjourney fokuserat på att bygga marknadsandelar och teknologi över en lönsam verksamhet. Företaget var redan lönsamt i augusti 2022. Midjourney använder en diffusionsmodell och djupinlärning för att skapa bilder från text eller till och med andra bilder, inklusive att bara använda en annan bild som en stil- eller karaktärsreferens. Till skillnad från Stable Diffusion är Midjourney-modellen sluten källkod och proprietär, så vi vet inte exakt hur den fungerar. Midjourney har också förblivit lojalt mot Discord, och fungerar genom en meddelandebot där du använder /imagine för att starta en prompt och lägger till prompten med -[kod], snarare än att använda ett webbgränssnitt där inställningar kan styras genom knappar och reglage. Det fungerar som alla andra AI-bildgeneratorer; du ger den en beskrivning av vad du vill se med hjälp av naturligt språk, och den går iväg och skapar det, ofta kommer den närmare än andra modeller. Om du inte redan har skapat mer än 1 000 bilder med Midjourney är det enda sättet att få tillgång till det genom Discord-boten. När du har betalat din månadsabonnemang kommer du att kunna få tillgång till Midjourney direktmeddelande-boten. För att börja skriver du bara /imagine och sedan din text. Om du vill ställa in orienteringen använder du -ar 16:9 (eller något annat förhållande) och om du vill använda mangamodellen skriver du till -niji. Midjourney har aldrig avslöjat de data som användes för att träna den kraftfulla bildgeneratorn. Det finns frågor kring proveniensen av de träningsdata som användes för att bygga AI-modellen från början, med många spekulationer om att mycket av det skrapades från öppna webben utan tillstånd från konstnärerna, fotograferna och skaparna av dessa verk. Företaget har kommit under ökande kritik både för hemlighetsmakeriet och sannolikheten att upphovsrättsskyddat material utgör en del av träningsdata. Tidigare i år delade konstnärer på sociala medier ett kalkylblad som en del av en stämningsansökan mot AI-startupen, där de påstod att de visade hur Midjourney byggde upp en databas med konstnärer för att träna modellen. Denna lista hade stilar, genrer och mer och inkluderade bidrag till kortspelet Magic the Gathering. En studie av AI-experten Gary Marcus och den digitala illustratören Reid Southern förra året fann betydande bevis på ´plagiatiska utdata´ från modeller som Midjourney och OpenAI´s DALL-E. De skrev: ´Dessa system informerar inte användarna när de [använder varumärkesskyddade bilder]. De ger ingen information om proveniensen för de bilder de producerar. Användarna kanske inte vet, när de producerar en bild, om de gör intrång.´ Midjourney´s grundare har stora planer för plattformen. Förutom att rulla ut webbgränssnittet till fler användare och göra det mer i linje med andra AI-bildgeneratorer som Leonardo eller NightCafe, vill Holtz också skapa holodeck från Star Trek - på sitt sätt. Hans plan är att sammanföra AI-bild-, video-, 3D- och realtidsmodeller för att skapa fullständigt uppslukande virtuella miljöer från en textprompt. Dessa miljöer kan sedan användas för att bygga ett spel, antagligen med hjälp av fler AI-prompts, eller för att skapa en AI-driven film där miljön fungerar som en scen.

Direktlänk

Direktlänk

Dela

Tom´s Guide fördjupade 26 mars

3 000+ kursdeltagare från svenska företag och offentliga verksamheter
har gått vår kurs "AI på jobbet".

» Nyheterna från en dag tidigare

AI-bildgeneratorn Midjourney expanderar med nya funktioner och planerar för framtiden

Några av våra kursdeltagare