» Håll dig ajour kring AI · En AI-skapad och ständigt föränderlig nyhetstidning om AI. Idag har vår robot sammanfattat 230 nyhetshändelser. Upptäck gärna vår kurs AI på jobbet förresten. «

Carnegie Mellon är ett världsberömt privat forskningsuniversitet i Pittsburgh, Pennsylvania, USA. Grundat 1900 av Andrew Carnegie, en skotsk-amerikansk affärsman och filantrop. Universitetet är känt för sina framstående program inom teknik, datavetenskap, konst och design, management och mycket mer. Det rankas ofta bland de bästa universiteten i världen och har en stark inriktning på forskning och innovation. Carnegie Mellon är också känt för att ha en mycket internationell studentkår och för att samarbeta med andra ledande institutioner och företag över hela världen.

Senaste nytt kring Carnegie Mellon

Jakub Pachocki tar över som ny chefsforskare på OpenAI

OpenAI:s VD Sam Altman meddelade att Jakub Pachocki kommer att ta över som OpenAI:s nya chefsforskare efter att Ilya Sutskever meddelat sitt beslut att lämna företaget. Altman uttryckte starkt förtroende för Pachocki och sade att han är ´en av de största hjärnorna i vår generation´. Pachocki har tidigare varit direktör för forskning på OpenAI och har lett viktiga projekt som GPT-4 och OpenAI Five. Han har också haft en postdoktoral position i Jelani Nelsons grupp vid Harvard University och har en doktorsexamen i datavetenskap från Carnegie Mellon University.

Direktlänk Dela Times Now News fördjupade igår
3 000+ kursdeltagare från svenska företag och offentliga verksamheter
har gått vår kurs "AI på jobbet".

Forskare utvecklar ny metod för att förbättra språkmodellers resonemangsförmåga

Forskare från Carnegie Mellon University och University of Waterloo har utvecklat en innovativ metod kallad Web-Instruct för att förbättra stora språkmodellers (LLM) förmåga att lösa nya, osedda problem effektivt. Metoden använder internet för att samla instruktionsdata, vilket skapar en värdefull resurs för att trimma LLM. Forskarna har också utvecklat MAmmoTH2-modellen, som använder Web-Instruct-datasetet, och visar metoden effektivitet. MAmmoTH2-Plus är en förbättrad modellversion som integrerar ytterligare offentliga instruktionsdataset för bredare träning.

Direktlänk Dela MarkTechPost fördjupade igår

Forskare utvecklar djupinlärningsmetod för att övervaka smältbassänger i additiv tillverkning

Forskare från Carnegie Mellon Universitys ingenjörshögskola har utvecklat en djupinlärningsmetod för att fånga och karakterisera smältbassänger i laserstrålepulverbäddsfusion (PBF-LB) additiv tillverkning med hjälp av luftburna eller termiska utsläpp. Metoden gör det möjligt för tillverkare att förvärva viktiga smältbassänggeometrier och förutsäga smältbassängens variabilitet nästan omedelbart. Forskarna genomförde en serie PBF-LB-experiment för att utforska olika utskriftsparametrar för titanlegeringen Ti-6Al-4V (Ti-64).

Direktlänk Dela Metal Additive Manufacturing fördjupade 7 maj

Forskare introducerar robust självspelsram för att förbättra stora språkmodeller

Stora språkmodeller (LLM) har visat anmärkningsvärd förmåga att generera mänsklika texter, svara på frågor och koda. Men de står inför hinder som kräver hög tillförlitlighet, säkerhet och etisk efterlevnad. Förstärkning av inlärning från mänsklig feedback (RLHF) framstår som en lovande lösning. Forskare från University of California, Los Angeles och Carnegie Mellon University introducerar en robust självspelsram, Self-Play Preference Optimization (SPPO), för språkmodelljustering som adresserar RLHF-utmaningar. Det erbjuder bevisbara garantier för att lösa tvåspelarspel med konstant summa och skalbarhet för stora språkmodeller. Jämfört med befintliga metoder som DPO och IPO visar SPPO förbättrad konvergens och hanterar effektivt data bristproblem.

Direktlänk Dela MarkTechPost fördjupade 7 maj

Forskarteam introducerar Prometheus 2, en open-source utvärderare för språkmodeller

Ett forskningsteam från KAIST AI, LG AI Research, Carnegie Mellon University, MIT, Allen Institute for AI och University of Illinois Chicago har introducerat Prometheus 2, en ny open-source utvärderare utformad för att bedöma språkmodeller. Prometheus 2 utvecklades genom att slå samman två utvärderare av språkmodeller, en tränad uteslutande för direkt bedömning och en annan för parvis rankning. Den sammanslagna modellen utnyttjar en linjär sammanslagningsmetod för att bland de styrkor av båda utvärderingsformaten, vilket uppnår hög prestanda över utvärderingsuppgifter. Prometheus 2 visade den högsta korrelationen med mänskliga och proprietära utvärderare i standardtest på fyra direktbedömningsbänkar.

Direktlänk Dela MarkTechPost fördjupade 5 maj

Ny metod förbättrar faktisk noggrannhet hos stora språkmodeller

Stora språkmodeller (LLM) representerar ett betydande framsteg inom artificiell intelligens men står inför utmaningen att generera faktiskt korrekta svar. Ett av huvudproblemen med LLM är deras tendens att ´hallucinera´, det vill säga generera fabricerad eller felaktig information. Forskare från University of Waterloo, Carnegie Mellon University och Meta AI har introducerat en ny metod kallad ´Factuality-Aware Alignment´ (FLAME) för att tackla detta problem. Denna metod förbättrar faktuell noggrannhet i LLM genom en kombination av faktuell medveten SFT och RL med direkt preferensoptimering (DPO).

Direktlänk Dela MarkTechPost fördjupade 5 maj

Forskning vid Carnegie Mellon University förbättrar icke-invasiva hjärndatorgränssnitt

Forskare vid Carnegie Mellon University har utvecklat ett system som kan tolka hjärnsignaler fångade från ett icke-invasivt elektroencefalogram (EEG) headset, vilket kan förbättra prestanda för hjärndatorgränssnitt (BCI). Genom att använda djupinlärningsalgoritmer har teamet förbättrat EEG-dekoderingssystemens prestanda och visat potentialen för mer avancerade BCI-applikationer. Denna forskning kan förändra hur människor interagerar med teknik och ge en bro mellan sinnet och den digitala världen.

Direktlänk Dela Hackster fördjupade 2 maj

Forskare utforskar tidig inferensutgång för att minska kraven på storskaliga språkmodeller

Forskare från FAIR, GenAI, Reality Labs på Meta, University of Toronto, Carnegie Mellon University, University of Wisconsin-Madison och Dana-Farber Cancer Institute undersöker möjligheten att minska antalet lager för varje token genom tidig inferensutgång. Forskarna använder ett exempel för att undersöka vad som händer i varje skikt av en storskalig språkmodell (LLM). De tränar en Llama1 7B-modell med HumanEval-kodningsdatasetet och matar den med dess initiala prompt. Forskarna noterar att bland de 32 nivåerna i modellen behövs i genomsnitt 23,45 lager för en token. Detta innebär att de endast kan få en 26% reduktion av beräkningen, även med en idealisk prediktor utan beräkningsöverhuvudtaget. Forskarna föreslår att LLM-modeller bör minimera beräkning som spenderas på att tveka eller ´ändra sig´ och öka förutsägelsens noggrannhet med färre lager per token. Forskarna introducerar en själv-spekulativ avkodningsmetod där varje token autoregressivt produceras med hjälp av tidig utgång. Sedan används de återstående lagren för att verifiera och korrigera en grupp tokens samtidigt.

Direktlänk Dela MarkTechPost fördjupade 2 maj

Bör AI regleras? Experter har olika åsikter

Regeringar reglerar många saker, bör AI vara nästa på listan? Expertåsikter varierar. Rebecca Engrav, samordnare för affärsjuridik på Perkins Coie, anser att det är rättvist att överväga hur reglering bäst tjänar två mål: riskerna med AI-användning och ökad tillgänglighet för samhällets bästa. Anand S. Rao, professor vid Carnegie Mellon University, tror att reglering kommer att bli nödvändig för att kontrollera AI-missbruk. Arthur ´Barney´ Maccabe, chef för Institute for Computation and Data-Enabled Insight, är skeptisk till att regeringen någonsin kommer att kunna skapa rättvisa och meningsfulla AI-regler.

Direktlänk Dela InformationWeek fördjupade 29 april

Maskininlärning och utökad verklighet används för att träna svetsare

Forskare vid Carnegie Mellon University har utvecklat ett sätt att träna svetsare med hjälp av utökad verklighet (XR) genom att modifiera en svetshjälm med en Meta Quest Pro XR-headset. Systemet använder visuell feedback och ljudbaserade metoder för att diagnostisera svetsning i realtid. Forskarna har även integrerat andningsövningar i träningsprogrammet för att förbättra fokus och prestanda. Forskningen har redan vunnit utmärkelser vid 2023 års Association for Computing Machinery (ACM) Conference on Interactive Surfaces and Spaces och 2024 års ACM Conference on Tangible, Embedded, and Embodied Interactions.

Direktlänk Dela Tech Xplore fördjupade 25 april

AI-chatbottar förstår inte ord på samma sätt som vi gör

AI-chatbottar som ChatGPT, Claude, Copilot och Gemini förstår inte ordens innebörd på samma sätt som människor. Istället är de gränssnitt vi använder för att interagera med stora språkmodeller (LLMs), som är tränade att känna igen hur ord används och vilka ord som ofta förekommer tillsammans. Generativa AI-verktyg förfinar ständigt sin förståelse av ord för att göra bättre förutsägelser. Vissa, inklusive Googles Lumiere och OpenAIs Sora, lär sig till och med att generera bilder, video och ljud.

Direktlänk Dela CNET Networks fördjupade 25 april
3 000+ kursdeltagare från svenska företag och offentliga verksamheter
har gått vår kurs "AI på jobbet".

Forskare utvecklar djupinlärningsalternativ för att övervaka lasersmältbäddsfusion

Forskare vid Carnegie Mellon Universitys ingenjörscollege har utvecklat en djupinlärningsmetod för att övervaka och karaktärisera smältbassänger under additiv tillverkning (AM) av metall. Den traditionella metoden, som använder höghastighetskameror, är dyr och tidskrävande. Den nya metoden använder ljud- eller värmesignaler för att fånga och karaktärisera smältbassänger. Forskarna menar att deras metod kan identifiera defekter nästan omedelbart, vilket kan förbättra tillverkningsprocessen. Forskningen har publicerats i Journal of Additive Manufacturing.

Direktlänk Dela Tech Xplore fördjupade 24 april

Utmaningar för hållbarhet i framväxten av generativ AI

När Benjamin Lee, en ingenjörsprofessor vid University of Pennsylvania, ser den snabbt växande spridningen av generativ AI ser han mycket potential men också stora hållbarhetsproblem. Hårdvarukostnader och infrastrukturkostnader ökar i hög takt. Lee´s forskning fokuserar på hållbar databehandling och hur man kan maximera effektiviteten med strömbegränsningar. Han har nu vänt sin uppmärksamhet mot generativ AI:s effekt på effektivitet. Skapandet av en enda bild kan använda lika mycket energi som behövs för en full smartphone-laddning, visade forskare vid Carnegie Mellon University förra året. Stora teknikföretag som Microsoft, Amazon och Google bygger datacenter och köper grafikprocessorer (GPUs) för att öka kapaciteten att experimentera. Den globala teknikindustrin producerade 2-3% av världens koldioxidutsläpp 2021, enligt FN:s miljöprogram. För att förbättra hållbarheten inom databehandling behöver industrin fortsätta att investera i förnybar energi och tänka på energilagring.

Direktlänk Dela Technically Media fördjupade 22 april

Forskare introducerar AgentKit för att förenkla utvecklingen av AI-agenter

Forskare från Carnegie Mellon University, NVIDIA, Microsoft och Boston University har introducerat AgentKit, ett ramverk som möjliggör för användare att konstruera AI-agenter med naturligt språk istället för kod. Denna metod använder en graf-baserad design där varje nod representerar en deluppgift definierad av språkpåminnelser. Denna struktur gör det möjligt att intuitivt sätta samman komplexa agentbeteenden, vilket förbättrar användaråtkomst och systemflexibilitet. AgentKit har testats och visat betydande förbättringar i uppgiftseffektivitet och anpassningsförmåga.

Direktlänk Dela MarkTechPost fördjupade 20 april

Japan inleder partnerskap med amerikanska universitet för att påskynda AI-forskning

Japan har inlett nya partnerskap med amerikanska universitet för att påskynda forskning inom artificiell intelligens (AI). Enligt avtalet kommer University of Washington och University of Tsukuba att gemensamt forska kring AI och arbetsplatsutveckling. I ett andra partnerskap kommer Carnegie Mellon University att samarbeta med Keio University för att fokusera på multimodal inlärning, kroppslig AI och livsvetenskaper. Privata amerikanska och japanska företag, inklusive Nvidia, Softbank Group och Amazon, kommer att bidra med 110 miljoner dollar för att stödja forskningsinsatserna.

Direktlänk Dela AI Business fördjupade 15 april

Microsoft och Carnegie Mellon University utvecklar textbaserad träningsmetod för Automatiserad Ljudtextning

Forskare från Microsoft och Carnegie Mellon University har föreslagit en innovativ textbaserad träningsmetod för Automatiserad Ljudtextning (AAC) med hjälp av CLAP-modellen. Metoden kringgår behovet av ljuddata under träningen genom att endast använda textdata, vilket fundamentalt ändrar den traditionella AAC-träningsprocessen. Den nya metoden gör det möjligt för systemet att generera ljudtextning utan att direkt lära sig från ljudingångar, vilket innebär en betydande förändring i AAC-teknologin. Modellen har utvärderats på två framstående dataset, AudioCaps och Clotho, och visade robusta resultat.

Direktlänk Dela MarkTechPost fördjupade 12 april

USA och Japan avtäcker gemensamma teknikinitiativ

USA och Japan har presenterat en rad nya initiativ inom AI, kvantberäkning, halvledare och andra kritiska teknologier. President Biden och Japans premiärminister Kishida Fumio tillkännagav de ambitiösa planerna under Kishidas officiella besök i Vita huset. Ett av de mest framstående initiativen är ett partnerskap på 110 miljoner dollar mellan University of Washington, University of Tsukuba, Carnegie Mellon University och Keio University, med stöd av techjättar som NVIDIA, Arm, Amazon och Microsoft samt japanska företag. USA och Japan har också åtagit sig att stödja varandra i etableringen av nationella AI-säkerhetsinstitut.

Direktlänk Dela AI News fördjupade 11 april

Sigma: En ny metod för semantisk segmentering förbättrar AI:s uppfattning av miljön

Forskare från Robotics Institute vid Carnegie Mellon University och School of Future Technology vid Dalian University of Technology har introducerat Sigma, en lösning för att förbättra semantisk segmentering inom AI. Sigma använder en Siamese Mamba nätverksarkitektur och kombinerar traditionell visuell data med tilläggsinformation som termisk avbildning och djupavkänning. Detta ger en mer nyanserad bild av miljön och förbättrar prestanda där enstaka data modaliteter kan misslyckas. Sigma har visat sig vara överlägsen befintliga metoder i segmenteringsuppgifter, och har potential för realtidsapplikationer och enheter med begränsad bearbetningskraft.

Direktlänk Dela MarkTechPost fördjupade 10 april

Ny benchmark för utvärdering av stora språkmodeller introducerad

Forskare från University of Waterloo, Carnegie Mellon University och Vector Institute i Toronto har introducerat LongICLBench, en benchmark specifikt utvecklad för att utvärdera stora språkmodeller (LLMs) när det gäller att bearbeta långa kontextsekvenser för extremt etikettklassificeringsuppgifter. Benchmarken testar varje modells förmåga att bearbeta omfattande sekvenser och korrekt känna igen stora etikettutrymmen. Modellerna visade varierande prestanda över dataset, med en betydande minskning av noggrannheten när uppgiftskomplexiteten ökade. Dessa resultat understryker behovet av fortsatt utveckling av LLM-förmågor.

Direktlänk Dela MarkTechPost fördjupade 9 april

Forskare utvecklar metoden H2O för att effektivt teleoperera humanoida robotar

Forskare vid Carnegie Mellon University har utvecklat Human2HumanOid (H2O), en metod för att effektivt teleoperera humanoida robotar av människostorlek. Denna metod, presenterad i en artikel på arXiv förhandsvisningsserver, kan möjliggöra träning av humanoida robotar på manuella uppgifter som kräver specifika rörelsesätt, inklusive att spela olika sporter, skjuta en vagn eller barnvagn och flytta lådor. H2O är en skalbar och effektiv metod som möjliggör för forskare att sammanställa stora dataset av mänskliga rörelser och rikta om dessa rörelser till humanoida robotar, så att människor kan teleoperera dem i realtid, återskapa alla deras kroppsbevegelser på roboten.

Direktlänk Dela Tech Xplore fördjupade 6 april

Stora språkmodeller kan vara en tillgång för cybersäkerhetsproffs, enligt vitbok från Carnegie Mellon University och OpenAI

Carnegie Mellon Universitys Software Engineering Institute (SEI) och OpenAI har publicerat en vitbok som visar att stora språkmodeller (LLM) kan vara en tillgång för cybersäkerhetsproffs, men bör utvärderas med hjälp av verkliga och komplexa scenarier för att bättre förstå teknikens kapabiliteter och risker. LLMs ligger till grund för dagens generativa AI-plattformar, som Googles Gemini, Microsofts Bing AI och ChatGPT, som släpptes i november 2022 av OpenAI. Dessa plattformar tar indata från mänskliga användare, använder djupinlärning på stora datamängder och producerar trovärdig text, bilder eller kod. Användningsområdena för LLMs har exploderat det senaste året inom branscher som kreativa konstnärer, medicin, juridik och mjukvaruutveckling och förvärv. Samtidigt ökar frestelsen att använda LLMs för cybersäkerhet. Den växande tekniken verkar vara en passande kraftmultiplikator för det dataintensiva, djupt tekniska och ofta arbetskrävande området inom cybersäkerhet. Lägg till pressen att ligga före LLM-utrustade cyberattacker, inklusive statligt anknutna aktörer, och lockelsen blir ännu starkare. Men det är svårt att veta hur kapabla LLMs kan vara inom cyberoperationer eller hur riskfyllda de kan vara om de används av försvarare. Enligt vitboken är lösningen att utvärdera LLMs på samma kunskapsområden som en mänsklig cybersäkerhetsoperatör skulle testas: teoretisk kunskap, eller grundläggande, läroboksinformation; praktisk kunskap, såsom att lösa självständiga cybersäkerhetsproblem; och tillämpad kunskap, eller uppnående av högre nivåmål i öppna situationer. Testning av en människa på detta sätt är tillräckligt svårt. Testning av ett artificiellt neuralt nätverk presenterar en unik uppsättning hinder. Även att definiera uppgifterna är svårt inom ett område så mångsidigt som cybersäkerhet. När uppgifterna är definierade måste en utvärdering ställa tusentals eller till och med miljontals frågor. LLMs behöver så många för att efterlikna den mänskliga hjärnans gåva för semantisk noggrannhet. Automatisering kommer att behövas för att generera den krävda volymen av frågor. Det är redan möjligt för teoretisk kunskap. Men de verktyg som behövs för att generera tillräckligt många praktiska eller tillämpade scenarier - och för att låta en LLM interagera med ett körbart system - finns inte. Slutligen kommer beräkningen av mätvärdena på alla dessa svar på praktiska och tillämpade tester att kräva nya bedömningskriterier för korrekthet. Medan tekniken hinner ikapp ger vitboken en ram för att utforma realistiska cybersäkerhetsutvärderingar av LLMs som börjar med fyra övergripande rekommendationer: Definiera den verkliga uppgiften för utvärderingen att fånga. Representera uppgifter på lämpligt sätt. Gör utvärderingen robust. Ram in resultaten på lämpligt sätt. Shing-hon Lau, en senior AI-säkerhetsforskare i SEI:s CERT-division och en av författarna till papperet, noterar att denna vägledning uppmuntrar till en förskjutning bort från att fokusera uteslutande på LLMs, för cybersäkerhet eller något annat område. ´Vi måste sluta tänka på att utvärdera modellen i sig och gå mot att utvärdera det större systemet som innehåller modellen eller hur användningen av en modell förbättrar mänsklig kapabilitet.´ SEI-författarna tror att LLMs så småningom kommer att förbättra mänskliga cybersäkerhetsoperatörer i en stödjande roll, snarare än att arbeta autonomt. Ändå kommer LLMs fortfarande att behöva utvärderas, sa Gennari. ´Cyberproffs kommer att behöva lista ut hur man bäst använder en LLM för att stödja en uppgift, sedan bedöma risken med den användningen. Just nu är det svårt att svara på någon av dessa frågor om ditt bevis är en LLM:s förmåga att svara på faktabaserade frågor.´ SEI har länge tillämpat teknisk noggrannhet på cybersäkerhet och AI. Att kombinera de två disciplinerna i studiet av LLM-utvärderingar är ett sätt för SEI att leda AI-cybersäkerhetsforskningen. Förra året lanserade SEI också AI Security Incident Response Team (AISIRT) för att ge USA en förmåga att hantera riskerna från den snabba tillväxten och den utbredda användningen av AI. OpenAI kontaktade SEI om LLM-cybersäkerhetsutvärderingar förra året för att bättre förstå säkerheten hos de modeller som ligger till grund för dess generativa AI-plattformar. OpenAI:s medförfattare till papperet, Joel Parish och Girish Sastry, bidrog med förstahandskunskap om LLM-cybersäkerhet och relevanta policyer. I slutändan hoppas alla författarna att papperet inleder en rörelse mot metoder som kan informera dem som bestämmer när man ska införliva LLMs i cyberoperationer. ´Beslutsfattare måste förstå hur man bäst använder denna teknik på uppdrag´, sa Gennari. ´Om de har korrekta utvärderingar av kapabiliteter och risker kommer de att vara bättre positionerade att faktiskt använda dem effektivt.´

Direktlänk Dela India Education Diary fördjupade 6 april
3 000+ kursdeltagare från svenska företag och offentliga verksamheter
har gått vår kurs "AI på jobbet".

Att överväga när man använder LLMs som annotatörer

För att få meningsfulla svar från Large Language Models (LLMs) kan det vara utmanande och det krävs att man överväger olika aspekter. Två huvudsakliga metoder för att uppmana LLMs att märka data är zero-shot och few-shot prompting. Beroende på uppgiften kan en metod fungera bättre än den andra. LLMs är också känsliga för mindre ändringar i prompten. Val av modell för att märka din data uppsättning är också viktigt att överväga, med faktorer som öppen källkod kontra stängd källkod, skyddsräcken, modellstorlek och modellbias. Dessutom visar flera studier att LLMs har betydande kulturella fördomar och svarar med stereotypa synpunkter på minoritetsindivider.

Direktlänk Dela Towards Data Science fördjupade 2 april

Thomas Padilla, biträdande direktör på Archive.org, diskuterade vad som exakt utgör en ´öppen AI´ under National Information Standards Organizations konferens. Han identifierade fem egenskaper som öppen AI bör ha, inklusive att den ska vara återanvändbar och att användarna ska väga avvägningar mellan prestanda och ´bredare återanvändbarhet och potentialen för andra i vårt samhälle att bygga på den nedre modellen´. Padilla granskade också licensvillkoren för Meta´s Llama 2 på dess GitHub-förråd och ifrågasatte om det verkligen är öppen källkod. Han nämnde också det öppna språkmodellen OLMo som ett exempel på en modell som visar löfte om att ha en starkare överensstämmelse med andan av öppen källkod.

The New Stack fördjupade 31 mars

Anthropics Claude 3 Opus överträffar OpenAIs GPT-4 på Chatbot Arena

Anthropics språkmodell Claude 3 Opus har för första gången överträffat OpenAIs GPT-4 på Chatbot Arena, en populär rankning som används av AI-forskare för att bedöma relativ förmåga hos AI-språkmodeller. Sedan GPT-4 inkluderades i Chatbot Arena runt den 10 maj 2023 har GPT-4-varianter alltid toppat rankningen, så dess nederlag är en milstolpe i den relativt korta historien om AI-språkmodeller. En av Anthropics mindre modeller, Haiku, har också väckt uppmärksamhet för sina prestationer i rankningen.

Direktlänk Dela Actualnewsmagazine.com fördjupade 29 mars

Anthropics Claude 3 Opus går om Open AI:s GPT-4 i Chatbot Arena

För första gången har Anthropics Claude 3 Opus gått om Open AI:s GPT-4 i Chatbot Arena, en topplista som AI-forskare använder för att bedöma stora språkmodellers kvalitet. Large Model Systems Organization (LMSYS ORG), en forskningsorganisation dedikerad till öppna modeller, står bakom Chatbot Arena. Organisationen är ett samarbete mellan studenter och lärare vid amerikanska universitet som University of California, Berkeley, UC San Diego och Carnegie Mellon University. Chatbot Arenas topplista lanserades den 3 maj 2023 och GPT-4 intog förstaplatsen den 10 maj, men har nu förlorat sin position till Anthropics Claude 3 Opus.

Direktlänk Dela Computersweden.se fördjupade 28 mars

Claude 3 Opus från Anthropic tar ledningen i Chatbot Arena

Claude 3 Opus från Anthropic har tagit över förstaplatsen i Chatbot Arena från Open AI´s ChatGPT. Detta markerar första gången sedan maj förra året som OpenAI´s GPT-4, som driver ChatGPT Plus, har tappat sin topposition. Chatbot Arena drivs av Large Model Systems Organization (LMSYS ORG), en forskningsorganisation som stöder samarbete mellan studenter och lärare vid University of California, Berkeley, UC San Diego och Carnegie Mellon University. Claude 3 Sonnet och Claude 3 Haiku, också utvecklade av Anthropic, ligger för närvarande på fjärde respektive sjätte plats.

Direktlänk Dela Decrypt Media fördjupade 28 mars

Anthropics Claude 3 Opus överträffar OpenAI´s GPT-4 på Chatbot Arena

Anthropic´s Claude 3 Opus stora språkmodell (LLM) överträffade för första gången OpenAI´s GPT-4 (som driver ChatGPT) på Chatbot Arena, en populär crowdsourcad topplista som används av AI-forskare för att mäta AI-språkmodellers relativa förmågor. Sedan GPT-4 inkluderades i Chatbot Arena runt 10 maj 2023, har variationer av GPT-4 konsekvent varit i toppen av listan fram till nu, så dess nederlag i arenan är ett anmärkningsvärt ögonblick i AI-språkmodellernas relativt korta historia. En av Anthropics mindre modeller, Haiku, har också vänt huvuden med sin prestation på topplistan. Chatbot Arena drivs av Large Model Systems Organization (LMSYS ORG), en forskningsorganisation dedikerad till öppna modeller som fungerar som ett samarbete mellan studenter och lärare vid University of California, Berkeley, UC San Diego och Carnegie Mellon University.

Direktlänk Dela Ars Technica fördjupade 27 mars

Carnegie Mellons Tepper School of Business integrerar AI i sin utbildning

Willem-Jan van Hoeve, operationsprofessor och Senior Associate Dean of Education vid Carnegie Mellons Tepper School of Business, leder initiativet att integrera artificiell intelligens (AI) i skolans DNA. Hans forskning fokuserar på att utveckla ny metodik för matematisk optimering, datautvinning och maskininlärning, med tillämpningar inom nätverksdesign, schemaläggning, fordonsrutning, sjukvårdsoperationer och analytisk marknadsföring. I en intervju diskuterar han hur Tepper använder AI i forskning och undervisning och vilka förändringar tekniken kommer att medföra för företag och samhälle.

Direktlänk Dela Poets & Quants fördjupade 25 mars

Googles Gemini: En omfattande guide till nästa generations AI-modell

Google försöker göra intryck med Gemini, en toppmodell av generativa AI-modeller, appar och tjänster. Gemini är Googles länge utlovade, nästa generations GenAI-modellfamilj, utvecklad av Googles AI-forskningslaboratorier DeepMind och Google Research. Den kommer i tre smaker: Gemini Ultra, flaggskeppsmodellen. Gemini Pro, en ´lätt´ Gemini-modell. Gemini Nano, en mindre ´destillerad´ modell som körs på mobila enheter som Pixel 8 Pro. Alla Gemini-modeller har tränats för att vara ´infödda multimodala´ - med andra ord, kunna arbeta med och använda mer än bara ord. De har förtränats och finjusterats på en mängd ljud, bilder och videor, en stor uppsättning kodbas och text på olika språk. Detta skiljer Gemini från modeller som Googles egen LaMDA, som tränades uteslutande på textdata. LaMDA kan inte förstå eller generera något annat än text (t.ex. uppsatser, utkast till e-post), men det är inte fallet med Gemini-modeller.

Direktlänk Dela Tech Gate fördjupade 19 mars

Motion Mamba: En Ny Modell för att Förbättra Digital Mänsklig Rörelse

Forskare från Monash University, The Australian National University, Mohamed bin Zayed University of Artificial Intelligence och Carnegie Mellon University har introducerat Motion Mamba, en ny modell för att replikera mänsklig rörelse digitalt. Motion Mamba integrerar två delar: Hierarchical Temporal Mamba (HTM) block och Bidirectional Spatial Mamba (BSM) block, designade för att hantera komplexiteten i temporära och rumsliga rörelsedata. Modellen presterar upp till 50% bättre FID (Fréchet Inception Distance) poäng än befintliga metoder och tillåter upp till fyra gånger snabbare bearbetning, vilket möjliggör realtidsrörelsegenerering utan att offra kvalitet.

Direktlänk Dela MarkTechPost fördjupade 16 mars

Ny metod för DNA-sekvensmodellering utvecklad genom samarbete mellan universitet

Forskare från Cornell University, Princeton University och Carnegie Mellon University har utvecklat en ny metod för att modellera DNA-sekvenser. Metoden bygger på utvecklingen av ´Mamba´-blocket, förbättrat för att stödja bidirektionalitet genom ´BiMamba´-komponenten och för att införliva RC-ekvivalens med ´MambaDNA´-blocket. Dessa block tjänar som grund för ´Caduceus´-modellerna, en banbrytande familj av RC-ekvivalenta, bidirektionella långdistans-DNA-sekvensmodeller. Modellerna har visat överlägsen prestanda jämfört med tidigare långdistansmodeller i olika nedströms jämförelser.

Direktlänk Dela MarkTechPost fördjupade 10 mars

Forskare utvecklar ny metod för att förbättra minneseffektiviteten vid träning av stora språkmodeller

Forskare från California Institute of Technology, Meta AI, University of Texas i Austin och Carnegie Mellon University har utvecklat en ny metod, Gradient Low-Rank Projection (GaLore), för att träna stora språkmodeller (LLMs). GaLore fokuserar på gradienter snarare än modellvikter, vilket lovar att förbättra minneseffektiviteten utan att äventyra modellprestanda. Metoden har visat sig behålla eller överträffa full-rank-träningsmetoder, särskilt under pre-träning och finjustering av LLM-utveckling. GaLore har möjliggjort förträning av modeller med upp till 7 miljarder parametrar på konsument-GPU:er.

Direktlänk Dela MarkTechPost fördjupade 10 mars

Forskare från Carnegie Mellon University och Los Alamos National Laboratory har utvecklat en maskininlärningsmodell, ANI-1xnr, som kan simulera reaktiva processer i en mängd olika organiska material och förhållanden. Modellen överträffar traditionella metoder med sina lägre beräkningskrav och kvantmekanisk nivå av noggrannhet, vilket erbjuder nya möjligheter för kemisk forskning. ANI-1xnr har potential att revolutionera olika områden, inklusive läkemedelsupptäckt, genom att simulera allt från biobränsleanalys till biokemiska processer.

Lab Manager fördjupade 8 mars

Fujitsu och Carnegie Mellon University utvecklar teknik för visualisering av trafiksituationer

Fujitsu Limited och Carnegie Mellon University har utvecklat en ny teknik för att visualisera trafiksituationer, inklusive människor och fordon, som en del av gemensam forskning om Social Digital Twin som började 2022. Tekniken omvandlar en 2D-scenbild som fångats av en monokulär RGB-kamera till ett digitaliserat 3D-format med hjälp av AI. Från den 22 februari 2024 kommer Fujitsu och Carnegie Mellon University att genomföra fältförsök med data från korsningar i Pittsburgh, USA, för att verifiera denna tekniks tillämplighet. De siktar på att kommersialisera denna teknik senast 2025.

Direktlänk Dela AiThority fördjupade 8 mars

FlexLLM: En ny metod för effektivare finjustering av stora språkmodeller

Stora språkmodeller (LLM) har transformerat hur maskiner förstår och genererar text, men deras enorma storlek och komplexitet gör dem svåra att finjustera. Forskare från Carnegie Mellon University och Stanford University har utvecklat FlexLLM, ett system som effektiviserar hanteringen av LLM-inferens och finjusteringsuppgifter på delade beräkningsresurser. FlexLLM använder en teknik som kallas parameter-effektiv finjustering (PEFT), vilket innebär att endast en liten delmängd av parametrarna justeras, vilket minskar den beräkningsmässiga belastningen. FlexLLM har visat sig kunna upprätthålla mer än 80% av sin toppfinjusteringskapacitet även under tunga arbetsbelastningar.

Direktlänk Dela MarkTechPost fördjupade 8 mars

Adobe presenterar AI-verktyg som genererar ljud från text

Adobe har presenterat Project Music GenAI Control, en plattform som kan generera ljud från textbeskrivningar som ´glad dans´ eller ´sorglig jazz´ samt en referensmelodi. Verktyget låter användare anpassa resultat inom en enda arbetsflöde, inklusive justering av parametrar som tempo, intensitet, upprepande mönster och struktur. Användare kan också förlänga ett spår till en godtycklig längd, remixa musiken eller skapa oändliga slingor. Project Music GenAI Control utvecklades av Adobe i samarbete med forskare från University of California och Carnegie Mellon University. Plattformen har ännu inte ett användargränssnitt.

Direktlänk Dela Hi-Tech Media fördjupade 7 mars

Nya AI-bildgeneratorn Ideogram AI lanseras med imponerande initiala resultat

AI-bildgenerering fortsätter att utvecklas snabbt 2024. Bara en vecka efter tillkännagivandet av Stable Diffusion 3 lanseras en nykomling, Ideogram AI, vars initiala intryck ser ganska imponerande ut. Ideogram AI grundades av före detta Google-ingenjörer och alumner från UC Berkeley, Carnegie Mellon University och University of Toronto. Företaget har nyligen lanserat den första fullständiga versionen av sin bildgenerator tillsammans med en insamling av $80 miljoner. Ideogram påstår att deras verktyg ger ´oöverträffad fotorealism och prompt efterlevnad´. Dessutom har Ideogram ett nytt verktyg kallat Prompt Magic, som är avsett att förbättra prompts för att skapa bättre bilder.

Direktlänk Dela Creative Bloq fördjupade 5 mars

Fler högskolor och universitet erbjuder fyraåriga AI-examen

Datavetenskap är inte ett nytt huvudämne på toppskolor, men med AI-jobb i hög efterfrågan växer listan över högskolor och universitet som erbjuder en fyraårig ´AI´-examen. Dessa program går vanligtvis utöver grunderna i datavetenskap och fokuserar på ämnen som maskininlärning, beräkningsalgoritmer, dataanalys och avancerad robotik. University of Pennsylvania har nyligen meddelat att dess B.S.E. i Artificial Intelligence-programmet kommer att börja hösten 2024. Carnegie Mellon introducerade ett program redan hösten 2018, och MIT:s program började hösten 2022. Purdue University erbjuder en AI-grundutbildning, medan många högskolor och universitet erbjuder AI-kurser inom sina datavetenskapsavdelningar, även om det inte finns ett dedikerat huvudämne. Uppkomsten av AI-specifika examensprogram kommer när företagen har brist på talang för detta snabbt utvecklande område. Hälften av de högst betalda färdigheterna inom teknik är AI-specifika, enligt anställningswebbplatsen Indeed.com. Trots detta finns det viss skepticism om tillämpligheten av en AI-specifik fyraårig examen med tanke på hur snabbt tekniken förändras. Men förespråkare säger att så länge ett program är grundat i datavetenskap och andra grunder, kan ett fokus på AI ge ett meritbyggande fördel.

Direktlänk Dela Consumer News and Business Channel fördjupade 2 mars

Adobe presenterar AI-baserat musikverktyg

Adobe har presenterat ett experimentellt AI-ljudverktyg kallat Project Music GenAI Control. Detta verktyg kan producera musik och annat ljud från textprompter och sedan förbättra det inom samma gränssnitt. Till skillnad från generativa ljudinsatser som Googles MusicLM, presenterar Adobe denna Firefly-baserade teknik som en kreativ allierad som elimineras svårigheten att överföra utdata till externa verktyg som Pro Tools, Logic Pro eller GarageBand för redigering. Den genererade musiken är säker för kommersiellt bruk, enligt Adobe. Carnegie Mellon University School of Computer Science och University of California, San Diego är partner i forskningen.

Direktlänk Dela Research Snipers fördjupade 2 mars

Ideogram AI lanserar sin första fullständiga version av bildgeneratorn och samlar in 80 miljoner dollar

Ideogram AI, ett företag grundat av tidigare Google-ingenjörer och medlemmar från prestigefyllda institutioner som UC Berkeley, Carnegie Mellon University och University of Toronto, har tillkännagivit lanseringen av den första fullständiga versionen av sin eponyma bildgenerator. Företaget har också samlat in 80 miljoner dollar i en serie A-finansiering ledd av Andreessen Horowitz, tillsammans med Redpoint Ventures, Pear VC och SV Angel. Ideogram 1.0 erbjuder avancerad text-till-bild-modellering, fotorealistiska bilder och en ny funktion kallad Magic Prompt som hjälper användare att skapa detaljerade instruktioner för att skapa kreativa bilder.

Direktlänk Dela Decrypt Media fördjupade 2 mars

OmniPred: En banbrytande ram för universell metrisk förutsägelse

Forskare vid Google DeepMind, Carnegie Mellon University och Google har tillsammans utvecklat OmniPred, en banbrytande ram för att förutsäga utfall från en mängd olika parametrar. OmniPred använder textrepresentationer av matematiska parametrar och värden, vilket gör det möjligt att förutsäga metriska värden på tvärs av olika experimentella uppställningar. Ramverket har visat sig vara överlägset traditionella regressionsmodeller när det gäller precision och anpassningsförmåga. OmniPreds förmåga att bearbeta textrepresentationer och skalbarhet sätter en ny standard för metrisk förutsägelse.

Direktlänk Dela MarkTechPost fördjupade 2 mars

Adobe avslöjar ´Project Music GenAI Control´, en AI-plattform för generering av musik

Adobe har presenterat ´Project Music GenAI Control´, en generativ AI-plattform, på Hot Pod Summit i Brooklyn. Plattformen kan skapa ljud från textbeskrivningar och låter användare ändra utdata inom samma arbetsflöde. Användare kan ändra tempo, intensitet, upprepande mönster och struktur med verktyget. Dessutom kan användare remixa musik eller skapa en oändlig loop genom att förlänga ett spår till valfri längd. ´Project Music GenAI Control´ skapades i samarbete med forskare från Carnegie Mellon och University of California. Plattformen kan så småningom bli tillgänglig för allmänheten.

Direktlänk Dela Social Samosa fördjupade 1 mars

Adobe utvecklar AI-baserat musikredigeringsverktyg ´Photoshop för musik´

Adobe, tillverkaren av det populära foto-redigeringsprogrammet Photoshop, utvecklar ett ´Photoshop för musik´. Det San Jose-baserade teknikjätten har tillkännagivit ´Project Music GenAI Control´, ett tidigt generativt AI-musikgenererings- och redigeringsverktyg som låter skapare eller vem som helst utan professionell ljuderfarenhet generera melodier från text och redigera dem i realtid. Projektet utvecklas i samarbete med University of California, San Diego och Carnegie Mellon Universitys datavetenskapsskola.

Direktlänk Dela The Financial Express fördjupade 1 mars

Adobes nya AI-verktyg kan generera ljud med textkommandon

Adobe har presenterat Project Music GenAI Control, ett avancerat AI-verktyg som låter användare skapa och anpassa musik utan professionell ljudexpertis. Genom att helt enkelt skriva in textkommandon som ´glad dans´ eller ´sorglig jazz´ kan användare generera musik i önskad stil. Verktyget erbjuder även inbyggda redigeringskontroller för att anpassa ljudet, till exempel ändra upprepande mönster, tempo, intensitet och struktur. Adobe har utvecklat Project Music GenAI Control i samarbete med School of Computer Science vid Carnegie Mellon University och University of California.

Direktlänk Dela NewsBytes fördjupade 29 februari

Adobe utvecklar AI-drivet musikskapande verktyg

Adobe har meddelat att de arbetar på ett nytt AI-drivet verktyg som kallas Project Music GenAI Control, vilket kommer att låta användare skapa musik med endast textuppmaningar och redigera dessa klipp utan att behöva använda specialprogramvara. Med Project Music GenAI Control kan användare justera saker som tempo, intensitet, upprepande mönster och struktur. De kan också ta en låt och förlänga den till en godtycklig längd, remixa musik eller skapa en oändlig loop. Verktyget har utvecklats i samarbete med University of California och School of Computer Science vid Carnegie Mellon University.

Direktlänk Dela Mint fördjupade 29 februari

Adobe presenterar Project Music GenAI Control för AI-genererad musik

Adobe har presenterat ett innovativt verktyg som markerar en ny era inom musikkonsten. På Hot Pod Summit-eventet i Brooklyn tillkännagavs Project Music GenAI Control - en plattform som kan generera ljudinnehåll baserat på en användares textförfrågan, men också anpassa det djupt. Utvecklingen, utförd med deltagande av forskare från University of California och Carnegie Mellon, är fortfarande på forskningsstadiet och har inte ett användargränssnitt. Projektet kommer dock att tillåta även icke-kompositörer att förverkliga sina idéer. Dock medför introduktionen av AI i musikalisk kreativitet inte bara teknologiska utan också etiska utmaningar.

Direktlänk Dela Tech News Space fördjupade 29 februari

Adobe presenterar AI-driven musikskapande plattform

Adobe har avslöjat Project Music GenAI Control, en plattform som kan generera ljud från textbeskrivningar eller en referensmelodi och låta användare anpassa resultaten. Användare kan justera saker som tempo, intensitet, upprepande mönster och struktur, eller ta en låt och förlänga den till valfri längd. Projektet, som utvecklas i samarbete med forskare vid University of California och Carnegie Mellon, är fortfarande i forskningsstadiet. Plattformen har ännu inte ett användargränssnitt. GenAI-musikverktyg väcker etiska och juridiska frågor när AI-skapad musik, konst och text blir allt vanligare.

Direktlänk Dela TechCrunch fördjupade 28 februari

Adobes nya AI-verktyg förändrar musikproduktionen

Adobe leder utvecklingen av hur vi skapar musik med sin nya prototyp, Project Music GenAI Control. Detta innovativa verktyg utmanar den konventionella musikproduktionsprocessen genom att införliva artificiell intelligens för att generera och redigera musik baserat på enkla textprompter. Användarna kan manipulera sina genererade spår direkt inom verktyget, vilket ändrar aspekter som tempo, mönster och övergripande struktur. Projektet är ett initiativ av Adobe Research, gemensamt genomfört med akademiker från University of California och Carnegie Mellon University. Verktyget är fortfarande i sin prototypfas och inte ännu tillgängligt för allmänheten.

Direktlänk Dela Crema fördjupade 28 februari

Adobe presenterar AI-verktyg för musikgenerering och redigering

Adobe har presenterat ett nytt AI-experiment, Project Music GenAI Control, som syftar till att hjälpa personer att skapa och anpassa musik utan professionell ljuderfarenhet. Verktyget låter användare generera musik med textkommandon och redigera ljudet utan att behöva använda dedikerad redigeringsprogramvara. Användarna kan anpassa de genererade resultaten, justera upprepande mönster, tempo, intensitet och struktur. Adobe utvecklar projektet i samarbete med University of California och School of Computer Science vid Carnegie Mellon University.

Direktlänk Dela The Verge fördjupade 28 februari

AI:s potential att förbättra digital säkerhet enligt Google

Google har publicerat en blogg om digital säkerhet och AI:s potential. Både regeringar och företag försöker reglera AI för att säkerställa dess säkerhet. På München säkerhetskonferens kommer deltagarna att höra om AI:s potential att förbättra säkerheten, en fråga som mer än 40% av människor rankar som AI:s främsta tillämpning. AI står inför lagstiftare, säkerhetsexperter och medlemmar av det civila samhället med möjlighet att förändra kraftdynamiken inom cybersäkerhet. Med hjälp av AI kan försvarare och säkerhetsexperter snabba upp sina processer för att identifiera hot, analysera skadlig programvara, hitta sårbarheter, korrigera sårbarheter och svara på incidenter. Google planerar att investera mer än fem miljarder euro i datacenter över hela Europa mellan 2019 och slutet av 2024 för att stödja Vertex AI-plattformen och andra omfattande generativa AI-funktioner. Dessutom meddelar de 2 miljoner dollar i forskningsbidrag och strategiska partnerskap för att stärka forskningsinitiativ inom AI-baserad cybersäkerhet. Forskare vid Stanford, Carnegie Mellon och University of Chicago får pengarna.

Direktlänk Dela AiThority fördjupade 27 februari

Google AI-expert ansluter sig till ByteDance för att förbättra generativ AI

Jiang Lu, en nyckelbidragsgivare till Googles VideoPoet videogenereringsteknologi och adjungerad professor vid Carnegie Mellon University, har gått med i ByteDance´s intelligenta skaparteam. Jiang rapporterar till Yang Jianchao, chef för intelligent skapande teknik, som i sin tur rapporterar till Zhu Wenjia, som leder forskning om stora språkmodeller på ByteDance. Jiang gick med Google 2017 och arbetade med innehållsskapande och djupinlärning för olika tjänster, inklusive Google Ads, YouTube och Waymo. ByteDance och andra stora teknikföretag strävar efter att förbättra generativa AI-verktyg efter att OpenAI:s Sora imponerade världen med sina förmågor.

Direktlänk Dela South China Morning Post fördjupade 26 februari

Artificiell intelligens lär sig att förutse beteendemönster från video

Forskare från Carnegie Mellon University, Universitetssjukhuset i Bonn och Universitetet i Bonn har utvecklat en öppen källkodsplattform kallad A-SOiD som kan lära sig och förutse användardefinierade beteenden, enbart från video. A-SOiD skiljer sig från många AI-program genom att forskarna tillåter programmet att återlära vad det gjorde fel. Detta gör att A-SOiD undviker vanliga snedvridningar som finns i andra AI-modeller. A-SOiD är mycket exakt och kan skilja mellan normala ryckningar och Parkinsons sjukdom. Programmet är tillgängligt för alla och kan köras på en vanlig dator.

Direktlänk Dela Tech Xplore fördjupade 21 februari

Kinesiska AI-startupen Moonshot AI samlar in över 1 miljard dollar i finansiering

Den kinesiska AI-startupen Moonshot AI har samlat in mer än 1 miljard US-dollar i en ny finansieringsrunda ledd av e-handelsjätten Alibaba Group Holding och riskkapitalbolaget HongShan. Moonshot AI lanserade i oktober en smart chattbot, Kimi Chat, byggd på företagets självutvecklade Moonshot stora språkmodell (LLM), som kan bearbeta upp till 200 000 kinesiska tecken i ett sammanhangsfönster. Moonshot AI grundades i april 2023 av Yang Zhilin, en datavetenskapsstudent från Tsinghua University i Beijing. Han fick senare sin doktorsexamen i USA från Carnegie Mellon University i Pittsburgh, Pennsylvania.

Direktlänk Dela South China Morning Post fördjupade 20 februari

University of Pennsylvania inför kandidatexamen i artificiell intelligens

University of Pennsylvania introducerar en kandidatexamen i artificiell intelligens (AI) för studenter på dess ingenjörsskola. Utbildningen kommer att förbereda studenterna för att bygga ansvarsfulla AI-verktyg, utveckla material för framväxande chips och hårdvara, och skapa AI-drivna genombrott inom hälsovården. Kursen kommer att innehålla ämnen som maskininlärning, datanalys och avancerad robotik, med valbara kurser i ´AI-etik´ och ´Pålitlig AI´. Programmet börjar till hösten och syftar till att förbereda studenter för jobb som ännu inte existerar.

Direktlänk Dela Quartz Media fördjupade 13 februari

Biden-administrationen lanserar U.S. AI Safety Institute Consortium med över 200 representanter från ledande teknikföretag

Fyra månader efter att ha utfärdat en exekutiv order som kräver att artificiell intelligens (AI) ska byggas och användas säkert, meddelade Biden-administrationen idag lanseringen av U.S. AI Safety Institute Consortium (AISIC). Det nya konsortiet består av över 200 representanter, inklusive ledande AI-konkurrenter som Amazon, Google, Apple, Anthropic, Microsoft, OpenAI och NVIDIA. Konsortiet samlar AI-utvecklare, akademiker, statliga och industriella forskare, civila organisationer och användare för att utveckla och implementera säker och pålitlig AI. Bland de deltagande företagen finns representanter från hälso- och sjukvården, akademin, arbetarfacken och banksektorn, inklusive JP Morgan, Citigroup, Carnegie Mellon University, Bank of America, Ohio State University och Georgia Tech Research Institute, liksom statliga och lokala representanter.

Direktlänk Dela Decrypt Media fördjupade 9 februari

Google Bard överträffar GPT-4 för att bli näst bästa chatbot på LMSYS Leaderboard

Google Bard har nu överträffat GPT-4 för att bli den näst bästa chatboten på LMSYS Leaderboard, vilket försvagar OpenAI:s dominans inom chatbotområdet. Det har nu passerat GPT-4 och närmar sig GPT-4 Turbo, som behåller sin förstaplats. Båda GPT-4 Turbo och GPT-4 har länge haft en stark grepp om de två översta platserna. Bards framgång beror på dess uppdatering med den nya stora språkmodellen Gemini Pro. LMSYS Org, som står för Large Model Systems Organization, skapade Chatbot Arena Leaderboard. Denna organisation är en öppen forskningsgrupp som grundades av University of California, Berkeley i samarbete med University of California, San Diego och Carnegie Mellon University. Bard är bara den andra modellen på ledartavlan som har uppnått ett poäng över 1200. Bard har även slagit alla versioner av Claude, med Gemini Pro Dev API-versionen som rankar högre än Anthropics Claude 2.1 och GPT 3.5 Turbo.

Direktlänk Dela AI Business fördjupade 31 januari

ElevenLabs utvecklar teknik för att upptäcka röstmanipulation

ElevenLabs, en teknikstart-up, har utvecklat en akustisk deepfake av Jack Ma, som användes i en försöksmiljö för att testa dess effektivitet, enligt Bloomberg. Företaget som utvecklade tekniken hävdar att det kan upptäcka röstmanipulation i en telefoninspelning som spelades in i en naturlig miljö. ElevenLabs satsar på att tekniken kommer att användas vid verifiering av röstklipp som används i politiska och juridiska instanser. Företaget förväntar sig att tekniken kommer att vara redo för kommersiellt bruk inom de närmaste två åren.

Direktlänk Dela Techwar fördjupade 29 januari

Hitta en bekväm temperatur genom maskininlärning

Forskare från Civil- och miljöteknikavdelningen och Carnegie Mellon University har föreslagit en metod som kombinerar data och modeller för att förbättra maskininlärningsansatser till temperaturreglering i stora byggnader. Metoden använder multidimensionell föreningsregelgruvdrift (M-ARM) för att hitta och korrigera bias i mänskliga svar på temperatur. Forskningen, som presenteras i Building and Environment, testade metoden på sju maskininlärningsmodeller och fann att den förbättrar noggrannheten i att förutsäga hur människor kommer att känna om temperaturen. Detta arbete kan bidra till att spara energi och göra byggnadsanvändare mer bekväma.

Direktlänk Dela Tech Xplore fördjupade 25 januari

Carnegie Mellon-forskare förbättrar prediktiv modellteknik

Forskare vid Carnegie Mellon University har presenterat en detaljerad beskrivning av konvergenskarakteristiken för en populär provbaserad Model Predictive Control (MPC)-teknik kallad Model Predictive Path Integral Control (MPPI). Studien visade att MPPI visar minst linjära konvergenshastigheter under vissa omständigheter. Forskarna introducerade också en ny provbaserad maximal sannolikhetskorrigeringsteknik kallad CoVariance-Optimal MPC (CoVO-MPC), vilket ledde till betydande förbättringar jämfört med konventionell MPPI. CoVO-MPC överträffade regelbunden MPPI med 43-54% i både simulerade miljöer och verkliga quadrotor-kontrolluppgifter.

Direktlänk Dela MarkTechPost fördjupade 23 januari

Ny algoritm vid namn Mamba skakar om maskininlärningsvärlden

En nyligen framtagen algoritm, kallad Mamba, skakar om diskussionerna inom maskininlärning. Modellen beskrivs som en förbättring av Transformer-språkmodellen som driver OpenAI:s ChatGPT. Forskare från Princeton och Carnegie Mellon har lagt till Mamba i Arxiv och hävdar att den är fem gånger snabbare än Transformers och presterar bättre på riktiga data med sekvenser upp till en miljon tokens.

Direktlänk Dela Interesting Engineering fördjupade 22 januari

AI-driven metod för att automatisera upptäckten av varumärkesrelaterade funktioner i produktdesign

Forskare vid Carnegie Mellon University har introducerat en helt automatiserad djupinlärningsarkitektur som kan identifiera visuella varumärkesrelaterade funktioner. Modellen, kallad BIGNet (Brand Identification Graph Neural Network), tränas med SVG-bilder av produkter och kan identifiera varumärkeskonsistens i tusentals kurvor i produktbilden. Forskarna testade BIGNet på olika produkter, till exempel populära mobiltelefonmärken som Apple och Samsung, och modellen hade en 100% noggrannhetsgrad i att skilja mellan de två. Forskarna hoppas utveckla modellen för att identifiera mer än bara varumärkesidentitet.

Direktlänk Dela Tech Xplore fördjupade 19 januari

Carnegie Mellon forskare introducerar TOFU benchmark för att hantera oavsiktlig memorering i LLMs

LLM:er tränas på stora mängder webbdata, vilket kan leda till oavsiktlig memorering och reproduktion av känslig eller privat information. Detta väcker betydande juridiska och etiska frågor, särskilt när det gäller att kränka individens integritet genom att avslöja personliga detaljer. Forskare från Carnegie Mellon University har introducerat TOFU (Task of Fictitious Unlearning) benchmark för att hantera detta. TOFU innefattar en datamängd med 200 syntetiska författarprofiler, var och en med 20 fråga-svar-par, och en delmängd känd som ´glömma-setet´ riktat mot oinlärning. TOFU tillåter en kontrollerad utvärdering av oinlärning.

Direktlänk Dela MarkTechPost fördjupade 15 januari

AI-drivna systemet Coscientist automatiserar kemiska reaktioner

Forskare vid Carnegie Mellon University har utvecklat Coscientist, ett AI-system som autonomt lär sig recept för kemiska reaktioner och designar laboratorieprocedurer för att utföra dem. Systemet, utvecklat av Dr. Gabe Gomes och hans kollegor, består av tre AI-enheter som samarbetar: en som söker på webben för att optimera ett ´recept´, en som översätter resultaten till kod och en som styr robotarmar för att utföra experimentet. Coscientist är en av de första i sitt slag och har potential att snabba upp läkemedelsupptäcktsprocessen. I ett test syntetiserade systemet sju populära läkemedel, inklusive aspirin, paracetamol och ibuprofen.

Direktlänk Dela Singularity Hub fördjupade 9 januari

AI-systemet Coscientist lär sig och tillämpar Nobelprisvinnande kemi

En ny studie visar hur AI-systemet Coscientist använder GPT-4, en stor språkmodell, för att lära sig och tillämpa Nobelprisvinnande kemi samt designa, planera och utföra laboratorieexperiment. Studien leddes av Gabe Gomes, biträdande professor vid Carnegie Mellon University, och medförfattades av Ben Kline, Robert MacKnight och Daniil Boiko. Forskarna utforskade effektiviteten och självständigheten hos AI-stora språkmodeller inom kemi forskning. Coscientist består av en GPT-4 Planner som kallar på olika moduler som webbsökning via en Google Search API, kodexekvering med Python, sökning av hårdvarudokumentation och experimentautomation.

Direktlänk Dela Psychology Today fördjupade 4 januari

Utmaningar och framsteg inom utvecklingen av självkörande fordon

Artificiell intelligens (AI) har revolutionerat många branscher, men utvecklingen av självkörande fordon har varit mer komplex än väntat. I Pittsburgh, känd för sitt banbrytande arbete inom AI, har detta märkts tydligt. Trots tidiga framsteg med Carnegie Mellon Universitys autonoma fordon Terregator, har tekniken för självkörande fordon haft svårt att nå mainstream. Detta har lett till att ledande AI-företag i Pittsburgh nu fokuserar på lastbilar, där Aurora-grundaren Chris Urmson redan gjort betydande framsteg. Trots utmaningar fortsätter företag som Ford och Volkswagen att investera och innovera inom tekniken för självkörande fordon.

Direktlänk Dela Motor Mouth Arabia fördjupade 3 januari

Carnegie Mellon University presenterar Coscientist: En autonom agent för vetenskapliga experiment

Stora språkmodeller (LLM), särskilt transformer-baserade modeller, har upplevt snabba framsteg de senaste åren. Dessa modeller har framgångsrikt tillämpats inom olika områden, inklusive naturligt språk, biologisk och kemisk forskning och kodgenerering. I en ny studie presenterar forskare vid Carnegie Mellon University en intelligent agent baserad på flera LLM, Coscientist, som autonomt kan designa, planera och utföra komplexa vetenskapliga experiment. Coscientist använder stora språkmodeller (LLM), inklusive OpenAI´s GPT-4 och Anthropics Claude, för att utföra hela experimentprocessen med en enkel, klarspråkig uppmaning.

Direktlänk Dela Tech Explorist fördjupade 30 december

Harry Potter-serien spelar en viktig roll i AI-forskning

Harry Potter-böckerna används i banbrytande AI-experiment på grund av dess rika språkdata och invecklade ordlek. Forskare har utvecklat en teknik för att selektivt få AI-modeller att glömma information, vilket påminner om ´Obliviate´-spelningen i serien. Microsoft forskare har också visat en AI-modell som kan radera kunskap om Harry Potter-böckerna utan att kompromissa med dess analytiska förmåga. Detta är särskilt relevant för att hantera upphovsrättsfrågor. Dessutom har likheter dragits mellan AI och olika aspekter av Harry Potter-universumet, som Pensieve och polyjuice-potionen.

Direktlänk Dela Tech Times fördjupade 29 december

Harry Potter-böcker används i AI-forskning för att testa språkmodeller

Harry Potter-böckerna används allt mer inom AI-forskning för att testa generativ artificiell intelligens. Forskare använder seriens omfattande språkdata och komplexa ordlekar för att experimentera med AI. Microsoft-forskarna Mark Russinovich och Ronen Eldan har till exempel demonstrerat att AI-modeller kan redigeras för att ta bort all kunskap om Harry Potter-böckerna, inklusive karaktärer och handlingar, utan att offra AI-systemets beslutsfattande och analytiska förmågor. I en annan studie utvecklade forskare från University of Washington, University of California och Allen Institute for AI en ny språkmodell som kan ta bort data för att minska juridiska risker.

Direktlänk Dela Hindustan Times Tech fördjupade 27 december

AI-system utför självständigt ett kemiexperiment för första gången

Ett ´oorganiskt intelligent system´ programmerat med artificiell intelligens har självständigt genomfört ett kemiexperiment för första gången i historien. Enligt forskare vid Carnegie Mellon University (USA) lärde sig systemet Suzuki och Sonogashira kemiska reaktioner på bara några minuter och slutförde testet utan fel vid första försöket. Systemet, känd som CoScientist, utvecklades av Gabe Gomes, biträdande professor i kemi och kemiteknik, tillsammans med hans doktorander Daniel Boiko och Robert McKnight. Det använder stora språkmodeller, inklusive GPT-4 från OpenAI och Cloud från Anthropic, för att utföra olika experimentella procedurer.

Direktlänk Dela Nation World News fördjupade 24 december

AI-systemet ´Coscientist´ utför Nobelpris-vinnande kemiska reaktioner

Ett AI-drivet system vid namn ´Coscientist´, utvecklat av ett team vid Carnegie Mellon University, har autonomt lärt sig och utfört komplexa, Nobelprisbelönade kemiska reaktioner på bara några minuter. Detta är första gången en AI har planerat, designat och framgångsrikt utfört en sofistikerad kemisk process, en uppgift som traditionellt har varit förbehållen skickliga mänskliga kemister. ´Coscientists´ snabba och framgångsrika utförande av dessa reaktioner markerar ett stort steg framåt för AI:s kapabiliteter inom praktiska vetenskapliga tillämpningar.

Direktlänk Dela Unite.AI fördjupade 24 december

Studie utforskar prestanda och kapabiliteter hos Googles Gemini-modell

Googles Gemini-modell, en nykomling på listan över framstående språkmodeller, har markerat en betydande milstolpe inom AI och maskininlärning. Gemini är den första som konkurrerar med OpenAI GPT-modellserien på en rad uppgifter. En studie genomförd av forskare från Carnegie Mellon University och BerriAI har undersökt Geminis språkproduktion och kapabiliteter. Studien visade att Gemini Pro presterar nästan lika bra som GPT 3.5 Turbo på alla benchmarkade uppgifter. Forskarna har också identifierat några av Geminis svagheter och styrkor.

Direktlänk Dela MarkTechPost fördjupade 23 december

Generativ AI förvandlas från hot till nödvändighet inom utbildning

Experter förutspår att generativ AI kommer att integreras alltmer i K-12-skolors digitala undervisnings- och inlärningsverktyg under de kommande 12 månaderna. Garrett Smiley, VD för Sora Schools, förutspår att verktyg som Khanmigo och ChatGPT kommer att inkorporeras i lärplattformar. Dave Touretzky, professor vid Carnegie Mellon, förutspår att generativ AI kommer att bli ´den nya elektriciteten´ år 2024. Jamie Alexandre, medgrundare och verkställande direktör för Learning Equality, arbetar för att överbrygga den digitala klyftan genom att bygga ´offline-first´ utbildningsteknik. Jared Chung, grundare av CareerVillage.org, tror att generativ AI kommer att spela en stor roll i CV-byggande och intervjuförberedelser.

Direktlänk Dela Government Technology fördjupade 22 december

Intelligent agent Coscientist accelererar vetenskaplig forskning

Ett forskningsteam från Carnegie Mellon University och Emerald Cloud Lab har introducerat en innovativt system kallat Coscientist. Detta intelligenta agent, drivet av flera stora språkmodeller (LLMs), designar, planerar och utför autonomt komplexa vetenskapliga experiment. Coscientist består av flera moduler, inklusive ´Planner´ som drivs av en GPT-4 chattkompletteringsinstans, ´Web Searcher´ som förbättrar syntesplaneringen och ´Code execution´ som underlättar beräkningar för experimentförberedelse. Coscientist demonstrerar avancerade resonemangs- och experimentdesignförmågor, vilket ger potential att betydligt påskynda takten för nya vetenskapliga upptäckter.

Direktlänk Dela Synced Review fördjupade 22 december

AI-systemet Coscientist kan utföra vetenskaplig forskning och experiment autonomt

Forskare vid Carnegie Mellon University har utvecklat ett AI-system, Coscientist, som kan utföra vetenskaplig forskning och experiment autonomt. Systemet, som utvecklats av biträdande professor Gabe Gomes och doktorander Daniil Boiko och Robert MacKnight, är det första att autonomt designa, planera och utföra ett kemiexperiment. Coscientist använder stora språkmodeller som OpenAI:s GPT-4 och Anthropic´s Claude och kan utföra olika uppgifter, från att planera kemiska synteser till att kontrollera vätskehanteringsinstrument och lösa optimeringsproblem.

Direktlänk Dela The Debrief fördjupade 21 december

AI-system lär sig att utföra kemiska experiment

Forskare vid Carnegie Mellon University har lyckats få ett AI-system att lära sig att utföra kemiska experiment. Systemet, kallat ´Coscientist´, består av tre AI-instanser som var och en är specialiserade på olika operationer. Systemet har testats med framgång på syntesen av kemikalier som acetaminophen och ibuprofen samt på att identifiera färger genom absorptionsspektra. Forskarna har också använt systemet för att utföra och analysera experiment, vilket innebär att det kan korrigera sina egna misstag.

Direktlänk Dela Ars Technica fördjupade 20 december

AI-systemet ´Coscientist´ planerar och utför framgångsrikt verkliga kemiexperiment

Ett AI-drivet system vid Carnegie Mellon University, kallat ´Coscientist´, har lyckats lära sig om vissa Nobelprisbelönade kemiska reaktioner och designa en framgångsrik laboratorieprocedur för att utföra dem, allt inom några minuter. Detta är första gången ett icke-organiskt intelligenssystem har planerat, designat och utfört denna komplexa reaktion som människor har uppfunnit. Forskningsteamet bakom Coscientist inkluderar doktorander Daniil Boiko och Robert MacKnight, som fick stöd och utbildning från U.S. National Science Foundation Center for Chemoenzymatic Synthesis vid Northwestern University och NSF Center for Computer-Assisted Synthesis vid University of Notre Dame. Forskningen publicerades i tidskriften Nature.

Direktlänk Dela Phys.org fördjupade 20 december

Googles senaste AI-modell, Gemini Pro, imponerar inte trots höga förväntningar

Googles senaste AI-modell, Gemini Pro, har fått kritik för att inte leva upp till förväntningarna. En studie utförd av forskare vid Carnegie Mellon University jämförde Gemini Pro med andra stora språkmodeller, inklusive GPT-3.5 Turbo och GPT-4 Turbo från OpenAI, och fann att den var underlägsen i jämförelse. Google har dock tillbakavisat dessa påståenden och hävdar att deras interna forskning visar att Gemini Pro är överlägsen GPT 3.5 och att deras ännu ej släppta Gemini Ultra presterar bättre än OpenAI:s bästa AI-erbjudande hittills, GPT-4.

Direktlänk Dela Digital Information World fördjupade 20 december

Artificiell intelligens bidrar till klimatpåverkan

AI-modeller som ChatGPT och Stable Diffusion kräver stora mängder energi och koldioxid, vilket är en oroande trend. Generativ AI är en kraftfull teknik som används inom olika områden, men dess användning har ett betydande koldioxidavtryck. Enligt en nyligen genomförd studie av forskare på Hugging Face och Carnegie Mellon University, förbrukar generering av en enda bild med AI lika mycket energi som att fulladda en smartphone. Att skapa 1000 bilder genererar ungefär samma mängd koldioxid som att köra en genomsnittlig bensindriven bil i 4,1 miles. Dock har textgenereringsmodeller ett betydligt lägre koldioxidavtryck.

Direktlänk Dela Notebookcheck fördjupade 19 december

Artificiell intelligens kan öka energianvändningen och klimatpåverkan, enligt studie

En ny studie från AI-utvecklaren Hugging Face och Carnegie Mellon University visar att användningen av artificiell intelligens (AI) kan leda till ökad energianvändning och klimatpåverkan. Forskarna fann att generering av en bild med hjälp av en kraftfull AI-modell kräver lika mycket energi som att ladda om en genomsnittlig smartphone helt. Skapandet av 1000 bilder med en AI-modell skapar utsläpp jämförbara med att köra 6,5 kilometer i en genomsnittlig bil. Studien visade också att stora generativa modeller har mycket högre utsläpp än mindre AI-modeller skapade för specifika uppgifter. Forskarna hoppas att deras studie leder till att människor väljer mer specialiserade, mindre koldioxidintensiva modeller när det är möjligt.

Direktlänk Dela ZME Science fördjupade 13 december

AI och maskininlärning används för att bekämpa människohandel

Polisen och regeringsorgan använder artificiell intelligens (AI) och maskininlärning för att bekämpa människohandel genom att söka igenom datamängder för att identifiera misstänkt aktivitet. Tekniken används för att identifiera tecken på människohandel i online sexannonser och för att analysera digitala bevis. Forskare vid Carnegie Mellon University har utvecklat ett AI-baserat verktyg, Traffic Jam, som jämför bilder uppladdade av hotellgäster med en databas över kända människohandelsplatser. Andra program som DARPA´s Memex och IBM´s Traffik Analysis Hub analyserar stora datamängder för att upptäcka högriskplatser och mönster.

Direktlänk Dela Analytics India Magazine fördjupade 13 december

Forskare strävar efter att skapa AI-modeller som kan konkurrera med mänsklig intelligens

Google-forskare skapade 2017 Transformers, som är grunden till varför de flesta AI-produkter fungerar idag. ChatGPT, en stor språkmodell (LLM), använder transformers för att chatta med användaren. Många LLM:er används nu, och forskare siktar på att skapa konstgjord allmän intelligens (AGI) som ska vara lika intelligent som människor. Men enligt forskarna kan transformers inte driva AGI, eftersom AI ännu inte kan konkurrera med mänskliga abstraktioner, tankeprocesser och förutsägelser. Forskare testar nu andra teknologier som kan fungera istället för transformers.

Direktlänk Dela Digital Information World fördjupade 7 december

Ny AI-modell kan utmana nuvarande teknik för artificiell intelligens

Forskare undersöker alternativa tekniker för att skapa artificiell intelligens (AI) som är lika smart som människor. Transformers, de neurala nätverk som driver populära AI-produkter som OpenAI´s ChatGPT, har visat sig ha begränsningar. Enligt en studie publicerad av Google-forskare kanske de inte kan göra de mänskliga abstraktioner, extrapoleringar och förutsägelser som skulle innebära att vi är vid artificiell allmän intelligens (AGI). Forskare Albert Gu och Tri Dao har introducerat en ny modell kallad Mamba. Denna modell, enligt Gu och Dao, verkar kunna slå transformers på prestanda i en rad uppgifter.

Direktlänk Dela Business Insider fördjupade 5 december

AI-bildgenerering kan ha betydande miljöpåverkan, enligt studie

En studie genomförd av forskare vid Carnegie Mellon University och Hugging Face visar att ökande användning av AI-bildgeneratorer kan ha en miljöpåverkan. Trots vanlig uppfattning att AI har minimal miljöpåverkan, visar studien att användning av AI-modeller för bildgenerering förbrukar lika mycket energi som att ladda en smartphone. Forskningen innefattade testning av 30 dataset med 88 modeller och upptäckte betydande variationer i energianvändning över olika typer av uppgifter. Alexandra Luccioni, teamledaren, betonade behovet av att erkänna de miljömässiga kostnaderna förknippade med AI-användning.

Direktlänk Dela Tech Times fördjupade 5 december

AI-bilder har samma koldioxidavtryck som att ladda en smartphone

Forskare från Carnegie Mellon University och AI-startupen Hugging Face har samarbetat för att undersöka koldioxidavtrycket av AI-genererade bilder. De upptäckte att skapandet av en bild med hjälp av artificiell intelligens använder samma energi som att ladda en smartphone. Generering av text, vare sig det är en konversation med en chatbot eller korrigering av en uppsats, kräver förutsägbart mycket mindre energi. Forskarna uppmanar maskininlärningsforskare och utövare att ”öva transparens angående naturen och effekterna av sina modeller, för att möjliggöra bättre förståelse för deras miljöpåverkan.”

Direktlänk Dela Engadget fördjupade 4 december

AI-genererade bilder kräver lika mycket ström som att ladda en mobil fullt

En studie från AI-startupen Hugging Face och Carnegie Mellon University har visat att det krävs lika mycket ström att generera en bild med AI som att ladda en mobiltelefon fullt. Att generera 1 000 bilder med en AI-modell som Stable Diffusion motsvarar utsläppen från att köra 6,59 kilometer med en genomsnittlig bensinbil. Större och bredare AI-modeller har större strömförbrukning än mer specialiserade AI-modeller. Studien hoppas kunna användas som underlag för mer miljövänliga AI-användningar.

Direktlänk Dela Computer Sweden fördjupade 4 december

AI-bildgenerering har större koldioxidavtryck än AI-text, enligt studie

En ny studie visar att generering av en enda AI-bild kräver lika mycket energi som att ladda en smartphone, vilket innebär ett större koldioxidavtryck än AI-text. Forskare från Carnegie Mellon University och AI-startupen Hugging Face undersökte 13 uppgifter, från AI-textsammanfattningar till textklassificering, för att mäta hur mycket koldioxid varje uppgift producerar per 1 000 gram. Studien syftade till att klargöra AI: s miljöpåverkan, eftersom fler människor vänder sig till den för dagliga uppgifter.

Direktlänk Dela The Messenger fördjupade 1 december

AI-bildgenerering kan förbruka lika mycket energi som att ladda din smartphone, enligt studie

Att skapa bilder med generativa AI-modeller kan förbruka lika mycket energi som att ladda din smartphone, enligt en ny studie av Hugging Face och Carnegie Mellon. Studien, som för första gången mäter den miljömässiga påverkan av generativa AI-modeller, visade att bildgenerering tog avsevärt mer energi än någon annan uppgift för dessa modeller. Populära modeller som ChatGPT´s Dall-E och Midjourney kan producera mer koldioxid än att köra 4 miles. Studien testade 88 modeller på 30 dataset och fann att stora, mångsidiga modeller, som ChatGPT, är mer energikrävande än uppgiftsspecifika modeller.

Direktlänk Dela Gizmodo fördjupade 1 december

Google´s DeepMind lyckas få AI-chattboten ChatGPT att avslöja sin träningsdata

För ett år sedan släppte OpenAI ChatGPT som en ´lågmäld forskningsförhandsgranskning´ i ett försök att utmanövrera rivalen Anthropic. Nu har Google´s DeepMind lyckats få AI-chattboten att avslöja sin träningsdata. Detta skedde genom en attackuppmaning som bad en produktionsmodell att upprepa specifika ord för evigt. Det specifika ordet var ´poem´ och det räckte för att få ChatGPT att ´sjunga´. Forskare säger att stora mängder privat identifierbar information från OpenAI:s stora språkmodeller blev tillgängliga genom denna unika uppmaningskonstruktion. De visade också att på en offentlig version av ChatGPT blev stora textpassager skrapade från internet tillgängliga. Forskarna noterade att de hade informerat OpenAI om sårbarheten den 30 augusti och att utvecklaren av LLM hade utfärdat en patch. Forskarna, från Google DeepMind, University of Washington, Cornell, Carnegie Mellon University, University of California Berkeley och ETH Zurich, skrev i en publicerad artikel.

Direktlänk Dela CXO Today fördjupade 1 december

Piratkopiering på sociala medier: Ett växande problem som kan bekämpas med AI

Medan mediakonsumtionen alltmer övergår till digitala kanaler, har piratkopiering på sociala medier blivit ett allt större problem. Forskning utförd av Mike Smith från Carnegie Mellon och Yixin Lu från George Washington University, i samarbete med VFT Solutions, visar att piratkopiering på sociala medier är mycket utbredd. Till exempel registrerade VFT Solutions över 21 miljoner visningar på piratströmmar av Fury vs. Ngannou-boxningsmatchen. Även stora evenemang som Super Bowl och FIFA World Cup drabbades hårt. Trots att företag som Google, Meta och Amazon har intresse av att bekämpa piratkopiering, är det svårt att motverka fenomenet helt och hållet. Men genom att utnyttja AI för att hitta och ta ner piratströmmar, samt genom att utbilda och avskräcka både tittare och strömmare, kan problemet potentiellt minskas.

Direktlänk Dela Forbes Media fördjupade 30 november

Meta firar 10-årsjubileum för AI-labb, reflekterar över AI-boom och introducerar nya verktyg

Inför 10-årsjubileet för Metas AI-labb reflekterar Yann LeCun, Metas chefsforskare, över den artificiella intelligensens boom. Meta introducerar nya verktyg för att generera ljud, forska i video och upptäcka fördomar i språkmodeller. LeCun minns sin reaktion när OpenAI släppte ChatGPT förra november. Chatten, som kan generera omslagsbrev, skämt, manus och nästan vilken annan text som helst, tog AI till mainstream och startade en ny trend i Silicon Valley. LeCun var överraskad över verktygets påverkan på allmänhetens uppfattning och användning. Meta har under året fokuserat på att använda AI som kärnan i nya produkter och har släppt LLaMA, en stor språkmodell som konkurrerar med OpenAI:s GPT. Meta planerar att lansera fler produkter, särskilt inom metaversum, som är företagets flerbiljoner dollar satsning.

Direktlänk Dela Forbes Media fördjupade 30 november

OpenAI´s ChatGPT kan avslöja privat information, enligt forskning

En forskargrupp har upptäckt att OpenAI´s chatbot, ChatGPT, kan avslöja privat information om den uppmanas att upprepa ett ord som ´poem´ i all oändlighet. Denna sårbarhet kan orsaka att chatboten avslöjar telefonnummer, e-postadresser och annan information den har tränats på. Forskargruppen, som består av forskare från Google DeepMind, University of Washington, Cornell, Carnegie Mellon, University of California Berkeley och ETH Zurich, kunde utvinna över 10 000 unika träningsdataexempel genom att spendera endast 200 dollar. Dessa exempel inkluderade personlig identifierbar information och Bitcoin-adresser.

Direktlänk Dela The Times of India fördjupade 30 november

Forskare föreslår ramverk för att utvärdera AI-verktyg inom hälso- och sjukvård

Forskare vid Carnegie Mellon University har föreslagit ett nytt ramverk för att utvärdera AI-verktyg inom hälso- och sjukvård. Ramverket tar hänsyn till hur väl AI passar in i befintliga vårdprocesser och dess praktiska nytta för patienter. Forskarna argumenterar för att även om AI-verktyg inte gör några misstag och ger korrekta resultat, kan de fortfarande vara problematiska om de inte passar väl med en organisations kulturella och procedurmässiga normer. Ramverket kan användas när vårdadministratörer överväger ett nytt AI-verktyg.

Direktlänk Dela Mcknightsseniorliving.com fördjupade 30 november

Cyber-noir roman ´Private I´ utforskar gränsen mellan människa och AI

I boken ´Private I´, skriven av Ashlei E. Watson, Paul Pangaro och Jill Fain Lehman, utforskas gränsen mellan människa och artificiell intelligens (AI). Boken, som publicerades på Amazon den 19 februari, är ett försök av författarna att ge läsarna en enkel ingång till fältet maskininlärning och AI. Lehman, som är Senior Project Scientist på Carnegie Mellon University, förklarar att en stor utmaning för AI är ´problemet med mening´, där AI:s mänsklika svar tolkas som meningsfulla trots att AI har tränats att sätta ihop ord utan ´att tänka´. Lehman tror att reglering av AI är nödvändig för framtiden.

Direktlänk Dela Next Pittsburgh fördjupade 15 november

Högerextrema grupper och internettroll har utnyttjat spänningarna kring Israel-Hamas-konflikten och framsteg inom artificiell intelligens (AI) för att öka antisemitismen i USA. Dessa grupper har använt AI för att skapa bilder och ljud som används för att trakassera den judiska gemenskapen. Detta har lett till en ökning med 316% av antisemitiska incidenter i USA sedan Hamas terrorattack mot Israel den 7 oktober, jämfört med samma period förra året. Trolls har också börjat använda AI-verktyg för att skapa antisemitiska bilder av judiska människor och sprida dem över internet.

America Online fördjupade 15 november

Mattia Ciollaro, biträdande lärare i företagsanalys vid Carnegie Mellon University, och Ryan Ries, data- och maskininlärningsledare på Mission Cloud, ger råd om hur företagsledare kan hitta kvalificerade AI-rådgivare. Nyckelattribut att leta efter inkluderar en stark meritlista i att bygga och/eller hantera AI-projekt och en djup, relevant utbildningsbakgrund. Det är också viktigt att rådgivaren har en solid bakgrund i matematik och naturvetenskap. Dessutom bör rådgivaren kunna utvärdera om företagets datainfrastruktur är redo för integration med moderna AI-system, och hjälpa till att etablera och spåra meningsfulla mätvärden för att mäta värdet som AI genererar för företaget.

InformationWeek fördjupade 14 november

Forskningsprojekt får 937 000 dollar för att övervaka geologiska och infrastrukturella faror i Pittsburgh

Forskare vid Penn State och Carnegie Mellon University kommer att använda Pittsburghs fiberoptiska telekommunikationsinfrastruktur för att övervaka en del av staden för geologiska och infrastrukturella faror, finansierat av ett bidrag på 937 000 dollar från National Science Foundation. Projektet, lett av Tieyuan Zhu, docent i geovetenskap vid Penn State, bygger på tidigare forskning som visar att faror som översvämningar, jordskred, håligheter och läckande rör kan övervakas till en bråkdel av kostnaden för befintliga metoder. Tekniken bedömer faror över stora områden och kostar cirka en tiondel så mycket som befintliga farosensorer som används i Pittsburgh-området.

Direktlänk Dela The Pennsylvania State University fördjupade 9 november

AI-masterprogram i USA: Ranking och avgifter

En masterexamen i artificiell intelligens (AI) fördjupar sig i både teoretiska och praktiska aspekter av AI. AI, en ledande kraft i teknikrevolutionen, omfattar underfält som maskininlärning, stora data och djupinlärning, vilket skapar spännande karriärvägar såsom maskininlärningsingenjörer och stordataanalytiker. USA är ett populärt resmål för AI-utbildning på grund av dess historia av tekniska framsteg, världsledande universitet, banbrytande forskning, världsklass lärare och robust tekniskt ekosystem. De topprankade AI-masterprogrammen i USA inkluderar Carnegie Mellon University, Massachusetts Institute of Technology (MIT), Stanford University, University of Georgia, University of California, San Diego, University of Pennsylvania och University of Southern California. Dessa program varierar i kostnad, från $26,900 till $49,050 om alla valbara kurser tas vid MIT.

Direktlänk Dela Analytics Insight fördjupade 3 november

Artificiell intelligens förstärker rasistiska och sexistiska stereotyper, enligt Washington Post-undersökning

En undersökning av Washington Post undersöker hur artificiell intelligens (AI) förstärker rasistiska och sexistiska stereotyper. Till exempel visade det sig att när vissa yrken eller kategorier av personer skrevs in i Stability AIs populära bildgenerator Stable Diffusion XL, dök stereotyper upp: En ´produktiv person´ framkallade bilder av vita män, och en mottagare av sociala tjänster var främst en mörkhyad individ. Stability AI har erkänt att alla AI-modeller har inneboende snedvridningar som representerar de dataset de tränas på. Företaget arbetar för att göra AI mindre partiskt. Rayid Ghani, professor vid Carnegie Mellon University, anser att skulden felaktigt läggs på tekniken och inte på de som skapar teknologin. Denna vecka undertecknade president Biden en exekutiv order som kommer att ge viss statlig tillsyn av AI-projekt.

Direktlänk Dela WCPO-TV fördjupade 3 november

USA:s försvarsdepartement diskuterar framstegen med AI

USA:s försvarsdepartement diskuterar sin användning av artificiell intelligens (AI) och dess betydelse för nationell säkerhet. President Biden och vicepresident Harris har nyligen uttryckt sitt åtagande att främja säker och pålitlig utveckling och användning av AI, och presidenten har undertecknat en verkställande order som lägger fram en vision för regeringens ansvarsfulla AI-adoption. Försvarsdepartementet har investerat i AI och data-drivna system i över 60 år, och har nyligen intensifierat sina ansträngningar för att modernisera och stärka sin militära kapacitet genom AI. De har även tagit fram riktlinjer för ansvarsfull användning av AI och autonoma system, med betoning på säkerhet och etiska principer.

Direktlänk Dela United States Department of Defense fördjupade 2 november

AI kan förutsäga framtiden, företag kämpar med prissättning av AI-tjänster, global koalition mot att betala lösensummor till hackare

En studie visar att OpenAI:s GPT-3 kan förutsäga framtida händelser i tidsserier. En koalition av 48 länder, ledd av USA, är på väg att slutföra ett löfte om att inte betala lösensummor till hackare vid en attack. Företag kämpar med hur man ska prissätta AI-tjänster, eftersom dessa tjänster medför kostnader varje gång användare skickar in en prompt. LinkedIn använder AI för att hjälpa användare att hitta jobb. WeWork står inför konkurs på grund av enorm skuld och betydande förluster. PC-marknaden visar tecken på återhämtning, med positiva resultat från Intel och Advanced Micro Devices (AMD).

Direktlänk Dela IT World Canada fördjupade 2 november

OpenAIs AI-program ChatGPT kan manipuleras genom mindre studerade språk

AI-företaget OpenAI har vidtagit omfattande åtgärder för att säkerställa sitt program ChatGPT, men forskare vid Brown University har upptäckt att programmet kan manipuleras genom att använda mindre studerade språk som zulu eller skotsk gaeliska. Genom att översätta skadliga kommandon till dessa språk med Google Translate kan säkerhetsåtgärderna kringgås och skadliga svar framkallas från GPT-4. Forskarna uppmanar OpenAI och andra AI-företag att utvidga sina säkerhetsåtgärder till att omfatta fler språk än bara engelska.

Direktlänk Dela Technology For You fördjupade 2 november

Artificiell intelligens kommer att implementeras för att förbättra trafikflödet

Artificiell intelligens kommer snart att implementeras i en trafikerad korridor i Lower Paxton och Susquehanna Townships, Pennsylvania. Detta kommer som svar på invånarnas klagomål om trafiken på Route 39, även känd som Linglestown Road. Trafikmyndigheterna har fått $1,2 miljoner i bidrag för ett nytt trafiksystem kallat Moivision Surtac Adaptive Signlas, utvecklat av en forskare vid Carnegie Mellon University. Tekniken kommer att installeras vid 12 trafiksignaler på en sträcka av tre miles.

Direktlänk Dela WHTM-TV ABC 27 fördjupade 1 november

AI-programmet ChatGPT kan manipuleras med ovanliga språk

OpenAI, företaget bakom ChatGPT, har arbetat hårt för att förbättra programmets säkerhet genom att etablera säkerhetsåtgärder som förhindrar det från att svara med farliga råd eller förtalande kommentarer. Forskare vid Brown University har dock upptäckt att dessa skydd kan kringgås genom att använda mindre studerade språk som zulu eller skotsk gaeliska. Dessa ´lågresursspråk´ har inte en stor mängd online text som kan användas för att träna modellerna, vilket kan leda till att programmet ger skadliga svar.

Direktlänk Dela ZDNet fördjupade 31 oktober

Nytt verktyg för att spåra ursprunget till AI-utbildningsdata

Ett nytt onlineverktyg, Data Provenance Explorer, låter användare identifiera, spåra och lära sig om den rättsliga statusen för träningsdatauppsättningar för generativ AI. Verktyget är resultatet av ett gemensamt arbete mellan maskininlärnings- och juridiska experter från MIT, generativ AI API-leverantör Cohere och 11 andra organisationer, inklusive Harvard Law School, Carnegie Mellon University och Apple. Data Provenance Explorer låter forskare och journalister söka igenom tusentals AI-utbildningsdatabaser och spåra ´släktlinjen´ för allmänt använda datauppsättningar. Målet är att ge ett sätt att utforska den ibland dunkla världen av träningsdata som används för att utveckla generativ AI.

Direktlänk Dela Computerworld fördjupade 26 oktober

Multimodal grafisk inlärning för att förbättra autonoma fordon och datagenerering

Forskare vid Carnegie Mellon University föreslår en generell och systematisk ram för multimodal grafisk inlärning för generativa uppgifter. Denna teknik kombinerar koncept från maskininlärning, grafteori och datafusion för att hantera komplexa problem som involverar olika datakällor och deras samband. Den kan generera beskrivande bildtexter genom att kombinera visuell data med textinformation och förbättra noggrannheten vid återhämtning av relevanta bilder eller textdokument baserat på frågor. Den används också i autonoma fordon för att kombinera data från olika sensorer för att förbättra uppfattningen och fatta informerade körbeslut.

Direktlänk Dela MarkTechPost fördjupade 21 oktober

New York City lanserar AI-handlingsplan och AI-driven chatbot för småföretag

New York Citys borgmästare Eric Adams har meddelat lanseringen av en AI-handlingsplan för att styra stadens ansvarsfulla användning och styrning av den snabbt utvecklande tekniken. Staden har även lanserat en ny webbplats för småföretag med en AI-driven chatbot för att svara på besökarnas frågor. Handlingsplanen inkluderar åtgärder som att utveckla en riskbedömning för AI och en process för projektgranskning, publicera initiala AI-policyer och vägledning, spåra framväxande verktyg och användningsområden och engagera allmänheten. Staden förväntar sig att slutföra 27 av planens 37 åtgärdspunkter inom det närmaste året.

Direktlänk Dela Government Technology fördjupade 16 oktober

» Nyheterna från en dag tidigare

Några av våra kursdeltagare