1.

9.4

2.

9.3

3.

9.1

4.

8.8

5.

8.6

Claude AI-recensie |

Claude AI-recensie |

We zullen vrijwel zeker terugkijken op 2024 als het begin van een tijdperkbepalend decennium. Kunstmatige intelligentie maakte eindelijk de vroege beloften waar en kwam serieus. Nergens is dit duidelijker geweest dan in de strijd van de LLM's, de grote taalmodellen die de kern van de revolutie vormen.

Deze LLM's zijn de tools die we gebruiken op onze computers, telefoons en internet om toegang te krijgen tot de kracht van AI. Ze worden doorgaans gebruikt voor alles van het coderen van nieuwe websites tot het schrijven van e-mails, presentaties en nog veel meer. Typ of spreek een vraag en ze antwoorden met wat je nodig hebt. Het is als web zoeken op steroïden.

Of u nu gelooft in AI of er sceptisch over bent, het is onmogelijk om de enorme veranderingen te ontkennen die wereldwijd plaatsvinden, omdat mensen en bedrijven deze hulpmiddelen inzetten om persoonlijke en zakelijke taken serieus aan te pakken.

Twee van de belangrijkste protagonisten in de frontlinies zijn OpenAI met zijn ChatGPT-model en Anthropic met Claude. Van de twee is de grootste verrassing hoe snel Claude in zijn korte bestaan ​​is verbeterd. Anthropic werd in 2021 opgericht door ex-OpenAI-bestuurders en broers en zussen Dario en Daniela Amodei, om een ​​'public benefit company'-alternatief te bieden voor de gevestigde AI-bedrijven van die tijd.

Het bedrijf lanceerde de Claude LLM in 2023, aangekondigd als een 'veilig en betrouwbaar' model dat gericht zou zijn op het vermijden van AI-gevaren. Ondanks het ontvangen van meer dan $ 6 miljard aan investeringsbeloften van Google en Amazon, werd het eerste model van het bedrijf, Claude, uitgebracht met een lauwe publieke ontvangst. Het werd als te beperkend ervaren om praktisch algemeen bruikbaar te zijn.

De release van Claude 3.5 Sonnet in juni 2024 zette de AI-wereld echter echt in vuur en vlam, met zijn opmerkelijke bruikbaarheid en veelzijdigheid in een breed scala aan toepassingen. Opeens staat OpenAI tegenover een serieuze rivaal, die volgens veel mensen superieur is aan ChatGP, vooral op het gebied van programmeren en algemene taken van de gedachteketen.

Dit alles maakt het de moeite waard om te beoordelen als een van de beste grote taalmodellen ter wereld.

Claude recensie: Eerste indrukken

Claude

(Afbeelding tegoed: Claude)

Aanmelden voor een Anthropic-account is eenvoudig bij Claude.ai. Zodra u bent ingelogd met e-mail of een Google-account, kunt u direct beginnen met het gebruiken van de promptbox. Het standaard gratis account heeft een strikte limiet van 5 verzoeken per minuut en 300K tokens per dag. Dat klinkt als veel, maar het is heel gemakkelijk om die limieten te gebruiken als u echt begint met itereren op een project.

Als u meer wilt doen dan eenvoudig tekstwerk, zoals samenvattingen of vertalingen, dan kunt u beter upgraden naar het Pro Plan voor $ 20 per maand. Op dit niveau hebt u recht op 4000 verzoeken per minuut op een pay-as-you-go-basis.

Een andere goede optie is om een ​​app van derden en de Claude API te gebruiken, die geen duidelijke tarieflimieten lijkt te hebben. Ik gebruik de API regelmatig met TypingMind.com, op basis van PAYG-tokens en het is geweldig. Het enige probleem is dat API-gebruikers momenteel geen toegang hebben tot de Artifacts-functie van Claude, maar hopelijk komt dat binnenkort.

Claude recensie: In gebruik

Claude

(Afbeelding tegoed: Claude)

Belangrijk om op te merken is dat het Claude-universum is opgesplitst in twee secties. Claude chat (Claude.ai) is de openbare chatbot die de meeste mensen zullen gebruiken. Ontwikkelaars kunnen zich echter ook aanmelden voor de Console-versie, die meer diepgaand promptbeheer en engineering biedt, maar zonder de erg coole Artifacts-functie. Je kunt je voor beide aanmelden met hetzelfde e-mailadres, maar ze blijven gescheiden voor gebruiks- en factureringsdoeleinden, wat een beetje verwarrend is.

Ik heb verschillende tests uitgevoerd met behulp van standaardchat en Artifacts voor deze review. Artifacts is een gloednieuwe functie die een WYSIWYG-venster toevoegt naast het promptvenster, zodat u kunt zien wat de gegenereerde code creëert. Het is een fantastische manier om uw creatie voor uw ogen tot leven te zien komen. De code achter de resultaten is ook slechts een klik of download verwijderd, waardoor het een fluitje van een cent is om uw ideeën te itereren en te testen totdat ze perfect gevormd en klaar voor gebruik zijn.

Snelle tip: De functie Artifacts is standaard niet ingeschakeld. U moet op uw accountnaam klikken, linksonder op het Claude-startscherm, en deze handmatig inschakelen via de menuoptie Feature Preview.

De chatmodus werkte extreem goed, snel en nauwkeurig voor simpele taken, maar had moeite met complexere vereisten. Een geweldige functie die ik moet noemen, is dat als er een fout opduikt tijdens het herhalen van je idee, je deze gewoon kopieert en plakt in de Claude-chatbox en de AI lost het probleem meestal direct op. Dat is erg cool.

Claude

(Afbeelding tegoed: Claude)

Het duurde bijvoorbeeld maar een paar seconden om een ​​YouTube-reactie-analysator-webapp te maken met behulp van de YouTube API. Het duurde zelfs langer om de YouTube API te genereren dan om de app te maken, en de paar iteraties die ik gebruikte om de resultaten te polijsten, waren ook moeiteloos.

Claude

(Afbeelding tegoed: Claude)

Maar toen ik probeerde een complexere interactieve recepten-app te maken, waarbij ik gegevens uit een geüpload PDF-bestand haalde, werd het lastig. Maar ik wist precies wat het probleem was. Ik raakte het contextvenster kwijt vanwege de uitgebreide prompt-eisen die ik stelde.

Claude

(Afbeelding tegoed: Claude)

Ik kon een simpele versie van de app binnen enkele minuten aan de praat krijgen, maar zodra ik probeerde om wat te verfijnen door meer interactiviteit toe te voegen, raakten we contextruimte kwijt en begon Claude blunders te maken. Dat is jammer, want tot dat moment deed het het erg goed. Ik denk dat ik het probleem helemaal had kunnen vermijden met wat meer tijd en wat betere promptoptimalisatie.

Claude

(Afbeelding tegoed: Claude)

Als ik een echte jobbing coder was, had ik het handmatig kunnen afmaken, maar als enthousiaste amateur-bogger had ik geen schijn van kans. Maar het is absoluut duidelijk dat het niet lang meer zal duren voordat deze LLM's games en apps op aanvraag zullen produceren voor iedereen met een hartslag en een beetje verlangen.

Ik wilde ook de Console-applicatie testen, omdat het een van de recent gelanceerde productonderscheidende factoren is waar Claude duidelijk trots op is. Een erg handige functie van Console is de Workbench, waar je je prompts kunt testen, evalueren en verbeteren voordat je ze in de praktijk gebruikt. In de praktijk blijkt de Workbench een enorme tijd- en geldbesparing te zijn. Door verschillende combinaties van je voorgestelde prompts te testen voordat je credits eraan uitgeeft, krijg je de daadwerkelijke resultaten te zien en of het model goed reageert op je verzoek.

Claude

(Afbeelding tegoed: Claude)

De twee opvallende kenmerken van de Workbench zijn de mogelijkheid om deze diepgaande, multi-level testen uit te voeren en de bibliotheek met kant-en-klare prompts die het hele productieproces kunnen verkorten. Het echte doel van Console is echter duidelijk om bedrijven te helpen teams te runnen om hun AI-ontwikkeling te controleren. Er zijn functies die het gemakkelijk maken om medewerkers uit te nodigen en met hen te delen, evenals API-sleutels toe te wijzen en toegang te krijgen tot referentiedocumentatie.

Claude

(Afbeelding tegoed: Claude)

OpenAI biedt een vergelijkbare ervaring met zijn Playground, die meer functionaliteit bevat zoals fine-tuning en een assistent-maker. Ik weet echter niet zeker of het veel nuttiger is voor de behoeften van de meeste mensen. Fine tuning is bijvoorbeeld vaak een laatste redmiddel, omdat betere prompt engineering en function calling doorgaans veel voltooiingsproblemen van tevoren kunnen oplossen. Het is ook niet zo eenvoudig om relevante datasets te assembleren, op te schonen en te organiseren, wat op zijn beurt de effectiviteit van fine tuning vanaf het begin kan belemmeren.

Claude

(Afbeelding tegoed: Claude)

Hoe dan ook, de Anthropic Workbench en account hub functionaliteit zijn bewijs van de toewijding van het bedrijf aan de zakelijke markt. Het maakt het verschil tussen LLM-aanbieders die gewoon een basisproduct leveren en aanbieders die zich richten op het leveren van een waardevol AI-ecosysteem voor hun klanten. Het feit dat je promptcode kunt pakken, versies kunt bijhouden en alles kunt aanpassen, van modelinstellingen tot variabelen en de systeemprompt, maakt dit een volwassen plek om echt werk te doen. Anthropic heeft er goed aan gedaan om deze kant van zijn productaanbod uit te bouwen.

Claude recensie: Conclusie

Het is nog heel vroeg voor AI, chatbots en LLM's, dus elke review moet met die kanttekening in gedachten worden gelezen. We zien de eerste tekenen van een echte technologische revolutie en we moeten niet vanaf dag één wonderen verwachten. Dat gezegd hebbende, het werk dat Anthropic de afgelopen maanden heeft verricht om hun producten – met name Claude 3.5 Sonnet – concurrerend te maken op de markt, is verbazingwekkend. Dit nieuwste model heeft het bedrijf op veel gebieden naar de leiding gekatapulteerd, niet in de laatste plaats op het gebied van het programmeren van copiloten.

Dat wil niet zeggen dat andere modellen niet gelijk of superieur zijn in verschillende toepassingsgebieden, maar als het erop aankomt, lijken mensen gewoon de ingetogen kwaliteit van de Claude-ervaring te prefereren. Vanuit een persoonlijk oogpunt is 3.5 Sonnet nu mijn favoriete dagelijkse model, wat weerspiegelt hoe matig de recente aanbiedingen van OpenAI zijn geweest. Ik twijfel er geen moment aan dat de race nog maar net is begonnen en dat we binnenkort buitengewone resultaten zullen zien van AI-bedrijven over de hele wereld. Maar tot die tijd geniet ik graag van dit indrukwekkende stuk Amerikaans proza.

Gerelateerde blogs

CARV Review |

Terwijl ik de berg afslingte, een “bing!” klonk in mijn oor voor elke goede beurt die ik maakte. Naarmate ik meer en meer goede beurten

Ninja Prochef Wireless Thermometer Review

Ninja Prochef draadloze thermometer Prijs: $ 89Model: WP100EUSonde maat: 0,19 x 4 inch Laadkastgrootte: 0,9 x 1,77 x 6,4 inchGewicht (met hub): 4.16 ozGewicht (alleen

HEIST 3.0 HAAR DROYER REVIEW

Heist heeft de 3.0 Smart Hair Dryer uitgebracht met een gewaagde claim afgelopen zomer: dat dit de enige föhn is die speciaal voor mannen is