Kufijtë e tarifave rregullojnë numrin e kërkesave që mund t'i bëni API-së Gemini brenda një afati kohor të caktuar. Këto kufizime ndihmojnë në ruajtjen e përdorimit të drejtë, mbrojtjen nga abuzimi dhe ndihmojnë në ruajtjen e performancës së sistemit për të gjithë përdoruesit.
Si funksionojnë kufijtë e tarifave
Kufijtë e normës zakonisht maten në tre dimensione:
- Kërkesat për minutë ( RPM )
- Shenjat për minutë (hyrje) ( TPM )
- Kërkesat në ditë ( RPD )
Përdorimi juaj vlerësohet kundrejt çdo kufiri dhe tejkalimi i secilit prej tyre do të shkaktojë një gabim të kufirit të tarifës. Për shembull, nëse kufiri juaj i RPM është 20, bërja e 21 kërkesave brenda një minutë do të rezultojë në një gabim, edhe nëse nuk e keni tejkaluar TPM-në tuaj ose kufijtë e tjerë.
Kufijtë e tarifave zbatohen për projekt, jo për çelësin API.
Kuotat e kërkesave për ditë ( RPD ) rivendosen në mesnatë me orën e Paqësorit.
Kufijtë ndryshojnë në varësi të modelit specifik që përdoret, dhe disa kufizime zbatohen vetëm për modele specifike. Për shembull, Imazhe për minutë, ose IPM, llogaritet vetëm për modelet e afta për të gjeneruar imazhe (Imagen 3), por konceptualisht është i ngjashëm me TPM. Modele të tjera mund të kenë një kufi në ditë (TPD).
Kufijtë e tarifave janë më të kufizuara për modelet eksperimentale dhe ato paraprake.
Nivelet e përdorimit
Kufijtë e tarifave janë të lidhura me nivelin e përdorimit të projektit. Ndërsa përdorimi dhe shpenzimet tuaja të API-së rriten, do të keni një mundësi për të përmirësuar në një nivel më të lartë me kufij të rritur të tarifave.
Kualifikimet për nivelet 2 dhe 3 bazohen në shpenzimet totale kumulative në shërbimet e Google Cloud (duke përfshirë, por pa u kufizuar në, Gemini API) për llogarinë e faturimit të lidhur me projektin tuaj.
Niveli | Kualifikimet |
---|---|
Falas | Përdoruesit në vendet e pranueshme |
Niveli 1 | Llogaria e faturimit e lidhur me projektin |
Niveli 2 | Shpenzimet totale: > 250 dollarë dhe të paktën 30 ditë nga pagesa e suksesshme |
Niveli 3 | Shpenzimet totale: > 1000 dollarë dhe të paktën 30 ditë nga pagesa e suksesshme |
Kur kërkoni një përmirësim, sistemi ynë i automatizuar i mbrojtjes nga abuzimi kryen kontrolle shtesë. Ndërsa përmbushja e kritereve të deklaruara të kualifikimit është përgjithësisht e mjaftueshme për miratim, në raste të rralla një kërkesë për përmirësim mund të refuzohet bazuar në faktorë të tjerë të identifikuar gjatë procesit të rishikimit.
Ky sistem ndihmon në ruajtjen e sigurisë dhe integritetit të platformës Gemini API për të gjithë përdoruesit.
Kufijtë standardë të normës së API-së
Tabela e mëposhtme liston kufijtë e tarifave për të gjitha thirrjet standarde të Gemini API.
Niveli i lirë
Model | RPM | TPM | RPD |
---|---|---|---|
Modelet e nxjerrjes së tekstit | |||
Gemini 2.5 Pro | 5 | 250,000 | 100 |
Binjakët 2.5 Flash | 10 | 250,000 | 250 |
Gemini 2.5 Flash-Lite | 15 | 250,000 | 1000 |
Binjakët 2.0 Flash | 15 | 1 000 000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1 000 000 | 200 |
API e drejtpërdrejtë | |||
Binjakët 2.5 Flash Live | 3 seanca | 1 000 000 | |
Dialogu i audios vendase të shikimit paraprak të Flash Gemini 2.5 | 1 seancë | 25,000 | 5 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 seancë | 10,000 | 5 |
Gemini 2.0 Flash Live | 3 seanca | 1 000 000 | |
Modelet e gjenerimit multimodal | |||
Gemini 2.5 Flash Preview TTS | 3 | 10,000 | 15 |
Gjenerimi i imazheve të paraafishimit të Flash Gemini 2.0 | 10 | 200,000 | 100 |
Modele të tjera | |||
Gemma 3 & 3n | 30 | 15,000 | 14400 |
Binjakët Embedding | 100 | 30,000 | 1000 |
Modele të vjetruara | |||
Flash Gemini 1.5 (i vjetëruar) | 15 | 250,000 | 50 |
Gemini 1.5 Flash-8B (i vjetëruar) | 15 | 250,000 | 50 |
Niveli 1
Model | RPM | TPM | RPD | Shenjat e grumbulluara në radhë |
---|---|---|---|---|
Modelet e nxjerrjes së tekstit | ||||
Gemini 2.5 Pro | 150 | 2 000 000 | 10,000 | 5 000 000 |
Binjakët 2.5 Flash | 1000 | 1 000 000 | 10,000 | 3,000,000 |
Gemini 2.5 Flash-Lite | 4000 | 4 000 000 | Nuk ka kufi | 10,000,000 |
Binjakët 2.0 Flash | 2000 | 4 000 000 | Nuk ka kufi | 10,000,000 |
Gemini 2.0 Flash-Lite | 4000 | 4 000 000 | Nuk ka kufi | 10,000,000 |
API e drejtpërdrejtë | ||||
Binjakët 2.5 Flash Live | 50 seanca | 4 000 000 | ||
Dialogu i audios vendase të shikimit paraprak të Flash Gemini 2.5 | 3 seanca | 50,000 | 50 | |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 seancë | 25,000 | 50 | |
Gemini 2.0 Flash Live | 50 seanca | 4 000 000 | ||
Modelet e gjenerimit multimodal | ||||
Gemini 2.5 Flash Preview TTS | 10 | 10,000 | 100 | |
Gemini 2.5 Pro Preview TTS | 10 | 10,000 | 50 | |
Gjenerimi i imazheve të paraafishimit të Flash Gemini 2.0 | 1000 | 1 000 000 | 10,000 | |
Imazhi 4 Standard | 10 | 70 | ||
Imazhi 4 Ultra | 5 | 30 | ||
Imazhi 3 | 20 | |||
Veo 3 | 2 | 10 | ||
Veo 3 Fast | 2 | 10 | ||
Veo 2 | 2 | 50 | ||
Modele të tjera | ||||
Gemma 3 & 3n | 30 | 15,000 | 14400 | |
Binjakët Embedding | 3000 | 1 000 000 | ||
Modele të vjetruara | ||||
Flash Gemini 1.5 (i vjetëruar) | 2000 | 4 000 000 | ||
Gemini 1.5 Flash-8B (i vjetëruar) | 4000 | 4 000 000 | ||
Gemini 1.5 Pro (i vjetëruar) | 1000 | 4 000 000 |
Niveli 2
Model | RPM | TPM | RPD | Shenjat e grumbulluara në radhë |
---|---|---|---|---|
Modelet e nxjerrjes së tekstit | ||||
Gemini 2.5 Pro | 1000 | 5 000 000 | 50,000 | 500 000 000 |
Binjakët 2.5 Flash | 2000 | 3,000,000 | 100,000 | 400 000 000 |
Gemini 2.5 Flash-Lite | 10,000 | 10,000,000 | Nuk ka kufi | 500 000 000 |
Binjakët 2.0 Flash | 10,000 | 10,000,000 | Nuk ka kufi | 1,000,000,000 |
Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | Nuk ka kufi | 1,000,000,000 |
API e drejtpërdrejtë | ||||
Gemini 2.5 Flash Live | 1000 seanca | 10,000,000 | ||
Dialogu i audios vendase të shikimit paraprak të Flash Gemini 2.5 | 100 seanca | 1 000 000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 seancë | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1000 seanca | 10,000,000 | ||
Modelet e gjenerimit multimodal | ||||
Gemini 2.5 Flash Preview TTS | 1000 | 100,000 | 10,000 | |
Gemini 2.5 Pro Preview TTS | 100 | 25,000 | 1000 | |
Gjenerimi i imazheve të paraafishimit të Flash Gemini 2.0 | 2000 | 3,000,000 | 100,000 | |
Imazhi 4 Standard | 15 | 1000 | ||
Imazhi 4 Ultra | 10 | 400 | ||
Imazhi 3 | 20 | |||
Veo 3 | 4 | 50 | ||
Veo 3 Fast | 4 | 50 | ||
Veo 2 | 2 | 50 | ||
Modele të tjera | ||||
Gemma 3 & 3n | 30 | 15,000 | 14,400 | |
Binjakët Embedding | 5000 | 5 000 000 | -- | -- |
Modele të vjetruara | ||||
Flash Gemini 1.5 (i vjetëruar) | 2000 | 4 000 000 | ||
Gemini 1.5 Flash-8B (i vjetëruar) | 4000 | 4 000 000 | ||
Gemini 1.5 Pro (i vjetëruar) | 1000 | 4 000 000 |
Niveli 3
Model | RPM | TPM | RPD | Shenjat e grumbulluara në radhë |
---|---|---|---|---|
Modelet e nxjerrjes së tekstit | ||||
Gemini 2.5 Pro | 2000 | 8,000,000 | Nuk ka kufi | 1,000,000,000 |
Binjakët 2.5 Flash | 10,000 | 8,000,000 | Nuk ka kufi | 1,000,000,000 |
Gemini 2.5 Flash-Lite | 30,000 | 30 000 000 | Nuk ka kufi | 1,000,000,000 |
Binjakët 2.0 Flash | 30,000 | 30 000 000 | Nuk ka kufi | 5,000,000,000 |
Gemini 2.0 Flash-Lite | 30,000 | 30 000 000 | Nuk ka kufi | 5,000,000,000 |
API e drejtpërdrejtë | ||||
Gemini 2.5 Flash Live | 1000 seanca | 10,000,000 | ||
Dialogu i audios vendase të shikimit paraprak të Flash Gemini 2.5 | 100 seanca | 1 000 000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 seancë | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1000 seanca | 10,000,000 | ||
Modelet e gjenerimit multimodal | ||||
Gemini 2.5 Flash Preview TTS | 1000 | 1 000 000 | ||
Gemini 2.5 Pro Preview TTS | 100 | 1 000 000 | ||
Gjenerimi i imazheve të paraafishimit të Flash Gemini 2.0 | 5000 | 5 000 000 | ||
Imazhi 4 Standard | 20 | 15,000 | ||
Imazhi 4 Ultra | 15 | 5000 | ||
Imazhi 3 | 20 | |||
Veo 3 | 10 | 500 | ||
Veo 3 Fast | 10 | 500 | ||
Veo 2 | 2 | 50 | ||
Modele të tjera | ||||
Gemma 3 & 3n | 30 | 15,000 | 14400 | |
Binjakët Embedding | 10,000 | 10,000,000 | -- | -- |
Modele të vjetruara | ||||
Flash Gemini 1.5 (i vjetëruar) | 2000 | 4 000 000 | ||
Gemini 1.5 Flash-8B (i vjetëruar) | 4000 | 4 000 000 | ||
Gemini 1.5 Pro (i vjetëruar) | 1000 | 4 000 000 |
Kufijtë e tarifave të specifikuara nuk janë të garantuara dhe kapaciteti aktual mund të ndryshojë.
Kufijtë e normës së modalitetit të grupit
Kërkesat e modalitetit të grupit i nënshtrohen kufijve të tarifave të tyre, të ndara nga thirrjet API të modalitetit jo grupor.
- Kërkesa të njëkohshme për grupe: 100
- Kufiri i madhësisë së skedarit hyrës: 2 GB
- Kufiri i ruajtjes së skedarëve: 20 GB
- Shenjat e vendosura në radhë për model: Kolona Batch Requeued Tokens në tabelën e kufijve të normës liston numrin maksimal të argumenteve që mund të vendosen për përpunim grupor në të gjitha punët tuaja aktive të grupit për një model të caktuar. Shihni në tabelën standarde të kufijve të normës API .
Si të përmirësoni në nivelin tjetër
API Gemini përdor Faturimin në renë kompjuterike për të gjitha shërbimet e faturimit. Për të kaluar nga niveli Falas në një nivel me pagesë, fillimisht duhet të aktivizoni Faturimin në renë kompjuterike për projektin tuaj Google Cloud.
Pasi projekti juaj plotëson kriteret e specifikuara, ai bëhet i pranueshëm për një përmirësim në nivelin tjetër. Për të kërkuar një përmirësim, ndiqni këto hapa:
- Navigoni te faqja e çelësave API në AI Studio.
- Gjeni projektin që dëshironi të përmirësoni dhe klikoni "Përmirëso". Opsioni "Përmirëso" do të shfaqet vetëm për projektet që plotësojnë kualifikimet e nivelit të ardhshëm .
Pas një vërtetimi të shpejtë, projekti do të përmirësohet në nivelin tjetër.
Kërkoni një rritje të kufirit të tarifës
Çdo variacion modeli ka një kufi të normës së lidhur (kërkesa për minutë, RPM). Për detaje mbi këto kufij tarifash, shihni modelet e Binjakëve .
Kërkoni rritje të kufirit të tarifës së nivelit të paguar
Ne nuk ofrojmë asnjë garanci për rritjen e kufirit tuaj të tarifës, por do të bëjmë çmos për të shqyrtuar kërkesën tuaj.