Cloudflare verbetert AI-inferentieplatform met krachtige GPU-upgrade, snellere inferentie, grotere modellen, observeerbaarheid en een verbeterde vectordatabase
Cloudflare verbetert AI-inferentieplatform met krachtige GPU-upgrade, snellere inferentie, grotere modellen, observeerbaarheid en een verbeterde vectordatabase
Workers AI, de eenvoudigste plek voor het maken en opschalen van AI-apps, kan nu grotere modellen implementeren en complexere AI-taken verwerken
Workers AI, de eenvoudigste plek voor het maken en opschalen van AI-apps, kan nu grotere modellen implementeren en complexere AI-taken verwerken
San Francisco, Clifornië, 26 september 2024 – Cloudflare, Inc. (NYSE: NET), het toonaangevende connectiviteitscloudbedrijf, kondigde vandaag krachtige nieuwe mogelijkheden aan voor Workers AI en de verschillende bouwstenen voor de ontwikkeling van AI-apps. Workers AI is het serverloze AI-platform waarmee ontwikkelaars nu snellere, krachtigere en beter presterende AI-apps kunnen maken. Apps die op Workers AI zijn gemaakt, profiteren nu van onder meer snellere inferentie, grotere modellen en betere prestatiestatistieken. Workers AI is het eenvoudigste platform om wereldwijde AI-apps te maken en AI-inferentie dichter bij de gebruiker uit te voeren, waar ter wereld die zich ook bevindt.
Aangezien large language models (LLM's) kleiner en sneller worden, is de netwerksnelheid het knelpunt voor klanten die de LLM's willen gaan gebruiken en naadloze interacties met AI willen ervaren. Cloudflare's wereldwijde netwerk helpt netwerklatentie te verminderen. Het onderscheidt zich hiermee van andere netwerken die meestal uit geconcentreerde bronnen in een beperkt aantal datacenters bestaan. Cloudflare's serverloze inferentieplatform, Workers AI, beschikt nu over GPU's in meer dan 180 steden in de hele wereld. Het is gemaakt voor wereldwijde toegankelijkheid, zodat eindgebruikers van over de hele wereld van een lage latentie kunnen profiteren. Met dit netwerk van GPU's is Workers AI een van de grootste wereldwijde AI-platforms. Workers AI is ontworpen om AI-inferentie lokaal en zo dicht mogelijk bij de gebruiker uit te voeren, zodat klantgegevens dichter in de buurt blijven.
"Toen AI afgelopen jaar populair werd, dacht niemand dat netwerksnelheden tot AI-latentie zouden leiden. Het ging hierbij immers om nieuwe, experimentele interacties. Maar naarmate AI een steeds grotere rol in ons dagelijks leven speelt, worden het netwerk en milliseconden van cruciaal belang", zegt Matthew Prince, medeoprichter en CEO van Cloudflare. "Terwijl AI-workloads van training naar inferentie opschuiven, worden de prestaties en regionale beschikbaarheid van essentieel belang om de volgende fase van AI te ondersteunen. Cloudflare is het meest wereldwijde AI-platform op de markt. GPU's in steden overal ter wereld zullen AI van een nieuw technisch snufje omvormen tot een onderdeel van ons dagelijks leven, net zoals sneller internet dat voor smartphones heeft gedaan.
Cloudflare introduceert ook nieuwe mogelijkheden waarmee het het eenvoudigste platform wordt om AI-apps mee te maken:
- Betere prestaties en ondersteuning voor grotere modellen: Cloudflare breidt zijn wereldwijde netwerk nu uit met krachtigere GPU's, zodat Workers AI sneller de AI-inferentie kan uitvoeren op aanzienlijk grotere modellen, zoals Llama 3.1 70B en de collectie Llama 3.2-modellen met 1B, 3B, 11B (en binnenkort 90B). Dankzij ondersteuning voor grotere modellen, snellere responstijden en grotere contextvensters, kunnen AI-apps die op Workers AI van Cloudflare zijn gemaakt complexere taken efficiënter uitvoeren. Dit resulteert in natuurlijke, naadloze ervaringen voor eindgebruikers.
- Verbeterde controle en optimalisering van AI-gebruik met permanente logs: Dankzij nieuwe permanente logs in AI Gateway, beschikbaar in open bèta, kunnen ontwikkelaars prompts van gebruikers en antwoorden van modellen langer opslaan. Daardoor kunnen ze beter analyseren en begrijpen hoe hun app presteert. Permanente logs bieden ontwikkelaars uitgebreid inzicht op basis van gebruikerservaringen, bijvoorbeeld in de kosten en duur van verzoeken. Dit stelt hen in staat om hun app te verbeteren. Sinds de lancering van afgelopen jaar heeft AI Gateway al meer dan twee miljard verzoeken verwerkt.
- Snellere en betaalbaardere zoekopdrachten: Vectordatabases maken het makkelijker voor modellen om eerdere inputs te onthouden. Zo kan machine learning praktisch worden ingezet voor zoekfuncties, aanbevelingen en tekstgeneratie. De vectordatabase van Cloudflare, Vectorize, is nu algemeen beschikbaar. Sinds augustus 2024 ondersteunt deze database indexen van maximaal vijf miljoen vectoren, ten opzichte 200.000 daarvoor. De gemiddelde latentie van zoekopdrachten is nu nog maar 31 milliseconden (ms), ten opzichte van 549 ms in het verleden. Dankzij deze verbeteringen kunnen AI-apps snel relevante informatie vinden, terwijl ze minder gegevens hoeven te verwerken. Dit zorgt er ook voor dat AI-apps betaalbaarder worden.
Bekijk de onderstaande bronnen voor meer informatie:
- Blog: Het grotere, betere en snellere AI-platform van Cloudflare
- Blog: Maak Workers AI sneller en efficiënter: prestatie-optimalisatie met KV cache-compressie en speculatief decoderen
- Bekijk online onze Builder Day-livestream voor demo's, productaankondigingen en meer, vandaag, 26 september, om 20.00 uur CET. Meld u aan op https://builderday.pages.dev.
Over Cloudflare
Cloudflare, Inc. (NYSE: NET) is een groot connectiviteitscloudbedrijf met een missie om een beter internet te helpen bouwen. Het stelt organisaties in staat om hun medewerkers, applicaties en netwerken overal sneller en veiliger te maken, terwijl de complexiteit en de kosten afnemen. Cloudflare's connectiviteitscloud levert het meest complete, uniforme platform van cloud-native producten en ontwikkelaarstools, zodat elke organisatie de controle kan krijgen die ze nodig hebben om te werken, te ontwikkelen en hun bedrijf te versnellen.
Cloudflare wordt aangedreven door een van 's werelds grootste en meest verbonden netwerken en blokkeert dagelijks miljarden dreigingen online voor haar klanten. Miljoenen organisaties vertrouwen erop, van de grootste merken tot ondernemers en kleine bedrijven tot non-profitorganisaties, humanitaire groepen en overheden over de hele wereld.
Kom meer te weten over Cloudflare’s connectivitetiscloud op cloudflare.com/connectivity-cloud. Kom meer te weten over de laatste internettrends en -inzichten op https://radar.cloudflare.com.
Volg ons: Blog | X | LinkedIn | Facebook | Instagram
Toekomstgerichte uitspraken
Dit persbericht bevat toekomstgerichte uitspraken zoals bedoeld in Sectie 27A van de Securities Act van 1933, zoals gewijzigd, en Sectie 21E van de Securities Exchange Act van 1934, zoals gewijzigd, welke uitspraken aanzienlijke risico's en onzekerheden met zich meebrengen. In sommige gevallen kun je toekomstgerichte uitspraken herkennen aan woorden als 'kunnen', 'zullen', 'zouden moeten', 'verwachten', 'verkennen', 'plannen', 'anticiperen', 'zouden kunnen', 'voornemen', 'doel', 'projecteren', 'overwegen', 'geloven', 'schatten', 'voorspellen', 'potentieel' of 'doorgaan' of de negatieve equivalenten van deze woorden, of andere soortgelijke termen of uitdrukkingen die Cloudflare's verwachtingen, strategie, plannen of bedoelingen betreffen. Niet alle toekomstgerichte uitspraken bevatten echter deze identificerende woorden. Expliciete of impliciete toekomstgerichte uitspraken in dit persbericht omvatten, maar zijn niet beperkt tot, uitspraken over de capaciteiten en effectiviteit van Workers AI, AI Gateway, Vectorize, R2 en andere producten en technologie van Cloudflare, de voordelen voor klanten van Cloudflare die voortkomen uit het gebruik van Workers AI, AI Gateway, Vectorize, R2 en andere producten en technologie van Cloudflare, de timing van de beschikbaarheid van Workers AI, AI Gateway, Vectorize, R2 of alle gerelateerde functies aan alle huidige en mogelijke Cloudflare-klanten, de technologische ontwikkeling van Cloudflare, toekomstig gebruik, groei, initiatieven of strategieën, en de uitspraken van de CEO van Cloudflare en anderen. Daadwerkelijke resultaten kunnen wezenlijk verschillen van die vermeld of geïmpliceerd in toekomstgerichte verklaringen door een aantal factoren, waaronder maar niet beperkt tot risico's die worden beschreven in Cloudflare's filings bij de Securities and Exchange Commission (SEC), waaronder Cloudflare's Quarterly Report on Form 10-Q ingediend op 1 augustus 2024, evenals andere filings die Cloudflare van tijd tot tijd kan doen bij de SEC.
De toekomstgerichte uitspraken in dit persbericht hebben alleen betrekking op gebeurtenissen op het moment waarop de uitspraken zijn gedaan. Cloudflare neemt geen verplichting op zich om toekomstgerichte verklaringen in dit persbericht bij te werken om gebeurtenissen of omstandigheden na de datum van dit persbericht te weerspiegelen of om nieuwe informatie of het optreden van onverwachte gebeurtenissen te weerspiegelen, behalve zoals vereist door de wet. Het is mogelijk dat Cloudflare de plannen, bedoelingen of verwachtingen die in de toekomstgerichte verklaringen van Cloudflare worden vermeld, niet daadwerkelijk realiseert en u moet niet overmatig vertrouwen op de toekomstgerichte verklaringen van Cloudflare.
© 2024 Cloudflare Inc. Alle rechten voorbehouden. Cloudflare, het Cloudflare-logo en andere Cloudflare-merken zijn handelsmerken en/of geregistreerde handelsmerken van Cloudflare, Inc. in de VS en andere rechtsgebieden. Alle andere merken en namen waarnaar in dit document wordt verwezen, kunnen handelsmerken zijn van hun respectieve eigenaars.