Mit Gemini for Research schneller neue Erkenntnisse gewinnen

Gemini-Modelle können verwendet werden, um die Grundlagenforschung in verschiedenen Disziplinen voranzutreiben. So können Sie Gemini für Ihre Recherche nutzen:

  • Feinabstimmung: Sie können Gemini-Modelle für verschiedene Modalitäten abstimmen, um Ihre Forschung voranzutreiben. Weitere Informationen
  • Modellausgaben analysieren und steuern: Für weitere Analysen können Sie einen vom Modell generierten Antwortkandidaten mit Tools wie Logprobs und CitationMetadata untersuchen. Sie können auch Optionen für die Modellgenerierung und ‑ausgabe konfigurieren, z. B. responseSchema, topP und topK. Weitere Informationen
  • Multimodale Eingaben: Gemini kann Bilder, Audio und Videos verarbeiten und ermöglicht so eine Vielzahl spannender Forschungsrichtungen. Weitere Informationen
  • Long-Context-Funktionen: Gemini 1.5 Flash hat ein Kontextfenster von 1 Million Tokens und Gemini 1.5 Pro ein Kontextfenster von 2 Millionen Tokens. Weitere Informationen
  • Grow with Google: Über die API und Google AI Studio können Sie schnell auf Gemini-Modelle für Produktionsanwendungsfälle zugreifen. Wenn Sie eine Google Cloud-basierte Plattform suchen, kann Vertex AI zusätzliche unterstützende Infrastruktur bereitstellen.

Um die akademische Forschung zu unterstützen und innovative Forschung voranzutreiben, bietet Google Wissenschaftlern und akademischen Forschern über das Gemini Academic Program Zugriff auf Gemini API-Guthaben.

Gemini ausprobieren

Mit der Gemini API und Google AI Studio können Sie mit den neuesten Modellen von Google arbeiten und Ihre Ideen in skalierbare Anwendungen umsetzen.

Python

from google import genai

client = genai.Client()
response = client.models.generate_content(
    model="gemini-2.0-flash",
    contents="How large is the universe?",
)

print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash",
    contents: "How large is the universe?",
  });
  console.log(response.text);
}

await main();

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [{
    "parts":[{"text": "How large is the universe?"}]
    }]
   }'

„In unserer Studie untersuchen wir Gemini als Vision-Language-Modell (VLM) und sein agentisches Verhalten in verschiedenen Umgebungen aus Robustheits- und Sicherheitsperspektive. Bisher haben wir die Robustheit von Gemini gegenüber Ablenkungen wie Pop-up-Fenstern bewertet, wenn VLM-Agents Computeraufgaben ausführen, und Gemini genutzt, um soziale Interaktionen, zeitliche Ereignisse und Risikofaktoren auf der Grundlage von Videoeingaben zu analysieren.“

„Gemini Pro und Flash mit ihrem langen Kontextfenster haben uns bei OK-Robot geholfen, unserem Projekt zur mobilen Manipulation mit offenem Vokabular. Gemini ermöglicht komplexe Anfragen und Befehle in natürlicher Sprache über den „Speicher“ des Roboters: In diesem Fall sind das frühere Beobachtungen, die der Roboter über einen langen Zeitraum hinweg gemacht hat. Mahi Shafiullah und ich verwenden Gemini auch, um Aufgaben in Code zu zerlegen, den der Roboter in der realen Welt ausführen kann.“

Gemini Academic Program

Qualifizierte akademische Forscher (z. B. Lehrkräfte, Mitarbeiter und Doktoranden) in unterstützten Ländern können sich für Gemini API-Guthaben und höhere Ratenlimits für Forschungsprojekte bewerben. Diese Unterstützung ermöglicht einen höheren Durchsatz für wissenschaftliche Experimente und fördert die Forschung.

Wir sind besonders an den Forschungsbereichen im folgenden Abschnitt interessiert, freuen uns aber über Bewerbungen aus verschiedenen wissenschaftlichen Disziplinen:

  • Bewertungen und Benchmarks: Von der Community empfohlene Bewertungsmethoden, die ein starkes Leistungssignal in Bereichen wie Faktualität, Sicherheit, Befolgung von Anweisungen, Argumentation und Planung liefern können.

  • Wissenschaftliche Entdeckungen beschleunigen, um der Menschheit zu helfen: Potenzielle Anwendungen von KI in der interdisziplinären wissenschaftlichen Forschung, einschließlich Bereichen wie seltene und vernachlässigte Krankheiten, experimentelle Biologie, Materialwissenschaft und Nachhaltigkeit.

  • Verkörperung und Interaktionen: Nutzung von Large Language Models zur Untersuchung neuartiger Interaktionen in den Bereichen verkörperte KI, Ambient Interactions, Robotik und Mensch-Computer-Interaktion.

  • Neue Funktionen: Wir untersuchen neue Agent-Funktionen, die erforderlich sind, um die Argumentation und Planung zu verbessern, und wie Funktionen während der Inferenz erweitert werden können (z.B. durch die Nutzung von Gemini Flash).

  • Multimodale Interaktion und multimodales Verstehen: Lücken und Chancen für multimodale Foundation Models für Analyse, Schlussfolgerung und Planung bei einer Vielzahl von Aufgaben identifizieren.

Berechtigung: Nur Einzelpersonen (Fakultätsmitglieder, Forscher oder Ähnliches), die einer gültigen Bildungseinrichtung oder akademischen Forschungsorganisation angehören, können sich bewerben. API-Zugriff und Guthaben werden nach Googles Ermessen gewährt und entfernt. Wir prüfen Anträge monatlich.

Recherche mit der Gemini API starten

Jetzt bewerben