Grok kann dir tatsächlich Memes erklären

An der Spitze der KI-Modellhierarchie stehen Modelle wie Gemini 1.5 Pro und GPT-4o sowie andere große Player wie Llama 3, Claude 3 und andere. Irgendwo in der Mischung haben wir das Grok-Modell von xAI. Die Funktionalität hat in den letzten Monaten zugenommen, und Elon Musk hat gerade eine neue Funktion für das Modell angekündigt, die wie aus einem Science-Fiction-Film wirkt. Grok kann jetzt Bilder verstehen und sogar Witze erklären.

Seit Grok die Fähigkeit erlangt hat, Bilder zu erzeugen, steckt es in einigen Schwierigkeiten. Natürlich fehlten jegliche Schutzmaßnahmen, um zu verhindern, dass Menschen problematisches Material erzeugen. Egal, es hat sich weiterentwickelt. Wenn Sie diesen Modus nutzen möchten, müssen Sie X Premium+-Abonnent sein. Dies ist die teuerste Zahlungsstufe, die das Unternehmen anbietet. Es kostet 16 $/Monat (22 $/Monat, wenn Sie sich über die App anmelden).

Grok kann jetzt Bilder verstehen

Damit uns ein KI-Modell in die AGI-Ära (Künstliche Allgemeine Intelligenz) führen kann, muss es multimodal sein. Dies bedeutet, dass es in der Lage ist, mehrere Medienformen zu verstehen und zu generieren. Grok erlangte die Fähigkeit, Bilder zu erzeugen, aber sie zu verstehen ist eine andere Geschichte.

Elon Musk hat auf X über Groks neu entdeckte Fähigkeit gepostet. Im Beispiel zeigt er, dass es eine Erklärung für ein hochgeladenes Bild liefern kann. Als Beispiel zeigte er Grok, wie er ein Meme erklärt. Das Meme zeigte ein Soldatenpaar, das Soldaten entdeckte, die vorgaben, tot zu sein (die zufällig auch Physiker waren).

Grok erklärt in sechs Aufzählungspunkten, was im Bild passiert, und endet mit einer Schlusserklärung. Wie genau war es also? Sagen wir einfach, dass Grok in absehbarer Zeit nicht mehr bei Comedy-Workshops sprechen wird. Das Modell war in der Lage, das Geschehen in der Szene zu identifizieren, z. B. die Soldaten, den Hügel und die Menschen am Boden.

Es heißt jedoch: „Der Humor kommt von der Pointe im zweiten Panel, wo ein Wachmann sagt: „Isaac Newton hat die Schwerkraft erfunden“, womit er andeutet, dass der Grund dafür, dass sich die Physiker nicht bewegen (und daher tot erscheinen), in der Schwerkraft liegt, für deren mathematische Beschreibung Newton berühmt ist , nicht erfinden.”

Es heißt auch, dass der Humor von der Tatsache herrührt, dass Physiker „würden sich so sehr ihrer Arbeit widmen, dass sie sich hinlegen würden, um die Schwerkraft zu studieren oder zu „entdecken“,„. Es wurde also eindeutig die Bedeutung des Witzes missverstanden.

Bedeutet das, dass Grok schlecht ist?

Nein, es bedeutet, dass die KI selbst einige Verbesserungen vornehmen muss. Es geht darum, einem Modell das Verstehen beizubringen Humoreine der menschlichsten Schöpfungen überhaupt. Darüber hinaus haben wir Zwillingen das gleiche Bild gegeben, um es zu verstehen, und es hat auch etwas falsch verstanden.

Die Models verstehen die einzelnen Elemente im Bild und haben ein oberflächliches Verständnis für Komödie; wenn auch sehr analytisch. Allerdings verstehen sie nicht, was der Künstler mit Wissenschaftlern zu tun hat, die es anal angehen, wenn es darum geht, Menschen in feineren Details der Sprache zu korrigieren. Wir sind uns nicht sicher, wie Unternehmen KI-Modellen dies beibringen können.