Groq on yritys, joka tarjoaa apin kautta tekoälypalveluita, eli voit käyttää tekoälyä esim. omasta Python koodista, groq api-rajapinnan kautta. Voit kokeilla palvelua ilmaiseksi, tai valita Developer / Enterprise tilauksen.
Suunnitelma | Hinta | Ominaisuudet |
---|---|---|
Ilmainen | 0 € |
|
Developer | Maksu per token |
|
Enterprise | Ota yhteyttä |
|
Chat-mallien käyttörajat
Malli | Pyyntöä / min | Pyyntöä / pv | Tokeneita / min | Tokeneita / pv |
---|---|---|---|---|
allam-2-7b | 30 | 7000 | 6000 | 500000 |
compound-beta | 15 | 200 | 70000 | Ei rajaa |
compound-beta-mini | 15 | 200 | 70000 | Ei rajaa |
deepseek-r1-distill-llama-70b | 30 | 1000 | 6000 | 100000 |
gemma2-9b-it | 30 | 14400 | 15000 | 500000 |
llama-3.1-8b-instant | 30 | 14400 | 6000 | 500000 |
llama-3.3-70b-versatile | 30 | 1000 | 12000 | 100000 |
llama3-70b-8192 | 30 | 14400 | 6000 | 500000 |
llama3-8b-8192 | 30 | 14400 | 6000 | 500000 |
llama-4-maverick-17b | 30 | 1000 | 6000 | 500000 |
llama-4-scout-17b | 30 | 1000 | 30000 | 500000 |
llama-guard-4-12b | 30 | 14400 | 15000 | 500000 |
llama-prompt-guard-2-22m | 30 | 14400 | 15000 | 500000 |
llama-prompt-guard-2-86m | 30 | 14400 | 15000 | 500000 |
kimi-k2-instruct | 60 | 1000 | 10000 | 300000 |
gpt-oss-120b | 30 | 1000 | 8000 | 200000 |
gpt-oss-20b | 30 | 1000 | 8000 | 200000 |
qwen3-32b | 60 | 1000 | 6000 | 500000 |
Puheentunnistusmallien käyttörajat
Malli | Pyyntöä / min | Pyyntöä / pv | Äänisekuntia / h | Äänisekuntia / pv |
---|---|---|---|---|
distil-whisper-large-v3-en | 20 | 2000 | 7200 | 28800 |
whisper-large-v3 | 20 | 2000 | 7200 | 28800 |
whisper-large-v3-turbo | 20 | 2000 | 7200 | 28800 |
Puheentuottomallien käyttörajat
Malli | Pyyntöä / min | Pyyntöä / pv | Tokeneita / min | Tokeneita / pv |
---|---|---|---|---|
playai-tts | 10 | 100 | 1200 | 3600 |
playai-tts-arabic | 10 | 100 | 1200 | 3600 |
Groq Chat on moderni interaktiivinen chat-rajapinta Groqin LPU™-inferencia-alustalle, jossa voit käyttää useita huippumalleja alansa johtavilta tuottajilta erittäin matalalla latenssilla ja kilpailukykyisellä token-hinnoittelulla.
Palvelun kuvaus
- Groq Chat Interface tarjoaa käyttäjäystävällisen chat-rajapinnan Groqin LLM-inferenssiin.
- Rajapinnan kautta on suora pääsy Google-, Meta- ja Mistral AI ‑mallien kaltaisiin huippumalleihin.
- Palvelu on saatavilla sekä pilvessä (GroqCloud™) että omissa datakeskuksissa (GroqRack™) saman ohjelmisto-API:n kautta.
Keskeiset teknologiat
- Groq LPU™ on ASIC-pohjainen prosessori, jossa funktioyksiköt ja muistielementit on optimoitu rinnakkaista inferenssiä varten.
- Sub-millisecond-latenssi takaa ennustettavan ja nopean vasteajan reaaliaikaisissa chat-sovelluksissa.
- Inferenssi skaalautuu token-perusteisella hinnoittelulla, ja alustaa käytetään muutamalla koodirivillä (REST/SDK).
Hyödyt ja rajoitteet
- Hyödyt
- Erittäin matala ja ennustettava latenssi reaaliaikaiseen keskusteluun
- Monipuolinen mallivalikoima yhden rajapinnan kautta
- Mahdollisuus pitää data omissa järjestelmissä GroqRack™-ympäristössä
- Rajoitteet
- Uudempi alusta, ekosysteemi kasvuvaiheessa
- Riippuvuus Groqin ja integroitujen mallintuottajien tuki- ja päivityspolitiikasta
Käyttöönotto
- Rekisteröidy GroqCloudiin tai ota omalle GroqRack™-laitteistolle yhteys
- Hanki API-avain ja asenna SDK tai käytä REST-rajapintaa
- Määritä chat-kutsut ja valitse haluamasi mallit
- Skaalaa käyttöä tarpeen mukaan pilvessä tai omassa datakeskuksessa
Groq Chat – laajennettu kuvaus
Alustan sub-millisecond-latenssi takaa ennustettavan ja äärimmäisen nopean vasteen reaaliaikaiseen keskusteluun, ja token-perusteinen hinnoittelu skaalautuu volyymien mukaan.
Avainominaisuudet
- Skaalautuvat inferenssipalvelut pilvessä (GroqCloud™) tai omissa datakeskuksissa (GroqRack™).
- Tuki REST-rajapinnalle ja SDK:lle, integrointi muutamalla koodirivillä.
- Token-perusteinen hinnoittelu, kilpailukykyinen yksikkökustannus.
- Yhtenäinen rajapinta useille eri mallintoimittajille.
Vertailu ChatGPT:n, Geminin ja Grokin kanssa
Ominaisuus | Groq Chat | ChatGPT (OpenAI) | Google Gemini | Grok (xAI) |
---|---|---|---|---|
Laitteisto | Groq LPU™ ASIC | NVIDIA GPU | Google TPU | GPU/TPU |
Latenssi | <1 ms deterministinen | tyypillisesti kymmeniä ms | tyypillisesti kymmeniä ms | vaihteleva, reaaliaikainen |
Mallivalikoima | Google, Meta, Mistral, paikalliset | GPT-3.5, GPT-4-perhe | Gemini-mallit | Grok-mallit |
Hinnoittelu | Token-perusteinen, volyymiskaalautuva | Token-perusteinen | Käyttöperusteinen | Kuukausitilaus X Premium+ |
Integraatiot | GroqCloud, GroqRack, REST, SDK | Web, mobiili, Microsoft-integraatiot | Google Workspace, Docs, Gmail | Twitter (X) -alusta |
Unique-piirteet | Sub-ms latenssi, LPU-teho | Kustomoitavat GPTs, tiedostojen lataus, kooditulkki | Laaja Google-ekosysteemi, NotebookLM | Live-data X-palvelusta, edgy-persoonallisuus |
Groq Chat vs. muut palvelut
- ChatGPT on vankka valinta sisällöntuotantoon, koodaukseen ja datan analysointiin sen laajojen ominaisuuksien kautta.
- Google Gemini loistaa syvässä integraatiossa Workspace-työkaluihin ja järeässä datankäsittelyssä, mutta on tiukempi moderoinnissaan.
- Grok tarjoaa reaaliaikaista tietoa X:n (ent. Twitter) datavirroista ja räväkän, vähemmän rajoitellun vuorovaikutuksen, mutta voi olla epäjohdonmukaisempi tarkkuudessa ja sensitiivisten sisältöjen käsittelyssä.
Ero Groq:n ja Grok:n välillä
- Groq on infrastruktuuri palvelu. Eli yritys, joka valmistaa supernopeita tietokoneen suoritinpiirejä tekoälyä varten.
- LPU-piirit ovat näitä erikoissuorittimia, jotka ajavat kielimalleja ja muita tekoälysovelluksia.
- Kun sanotaan “247 tokenia sekunnissa”, se tarkoittaa, että piiri voi lukea ja käsitellä noin 247 sanaa tai merkkiä joka sekunti.
- Viive (latenssi) on se hetki, kun lähetät pyynnön ja saat vastauksen – Groqin piirien suunnittelu pitää sen mahdollisimman pienenä.
- Rinnakkaisuus tarkoittaa, että piiri pystyy tekemään monta laskentatehtävää samanaikaisesti ilman hidastuksia.
- Grok on Elon Muskin xAI:n kuluttajille suunnattu chatbot, joka pohjautuu laajoihin kielimalleihin ja korostaa eettisten periaatteiden sekä reaaliaikaisten, avoimien vastauksien yhdistelmää.
- Nimilakiriidat: Groq rekisteröi tavaramerkkinsä 2016 ja haastoi xAI:n Grok-nimen häiritsevästä samankaltaisuudesta, mikä alleviivaa selkeän brändin merkitystä kilpaillulla AI-kentällä.