17 lutego 2026 Anthropic zaprezentowalo Claude Sonnet 4.6. Identyfikator modelu to claude-sonnet-4-6. Cena pozostaje taka sama jak w przypadku Sonnet 4.5, znacznie ponizej modeli Opus. Nowy model obsluguje okno kontekstowe o pojemnosci 1 miliona tokenow, do 64K tokenow wyjsciowych (300K przez Message Batches API z naglowkiem beta) oraz rozszerzone myslenie.
Glowne liczby: 70% mniejsze zuzycie tokenow przy 38% wyzszej dokladnosci w porownaniu z Sonnet 4.5. To nie jest drobna poprawka. To pelna wymiana generacyjna modelu sredniej klasy, na ktorym wiekszossc systemow produkcyjnych faktycznie dziala.
Model, ktory napedza produkcje, wlasnie dostal powazny upgrade
Oferta modeli Anthropic ma trzy poziomy. Opus na gorze: maksymalna inteligencja, najwyzsza cena, dluzsze czasy odpowiedzi. Haiku na dole: szybki i tani, ale ograniczony w rozumowaniu. Sonnet posrodku.
W praktyce, kiedy firma przetwarza tysiace zapytan API dziennie, nie uzywa najdrozszego modelu. Uzywa tego, ktory oferuje najlepszy stosunek jakosci, szybkosci i kosztu. Dla wiekszosci wdrozen produkcyjnych to model klasy Sonnet.
Sonnet 4.6 rozszerza te przewage. Zbliga sie do dokladnosci Opus zachowujac jednoczesnie szybkosc i cene, ktore uczynnily Sonnet standardowym wyborem produkcyjnym.
70% mniej tokenow, 38% wieksza dokladnosc: co to oznacza w praktyce?
Liczby w komunikacie prasowym to jedno. Zobaczmy, co oznaczaja w dzialajacym systemie.
Redukcja tokenow. Kazde zapytanie do modelu jezykowego zuzywa tokeny wejsciowe i wyjsciowe. Tokeny kosztuja. Redukcja o 70% oznacza, ze wywolanie API, ktore kosztowalo 0,10 USD w tokenach, teraz kosztuje okolo 0,03 USD. Przy 5.000 dziennych interakcji roznica przelicza sie na tysiace dolarow miesiecznie.
Wzrost dokladnosci. 38% wiecej dokladnosci zmienia to, co model moze niezawodnie obsluzyc. Zadania, ktore wczesniej wymagaly modelu Opus do uzyskania poprawnych wynikow, moga teraz wchodzic w zakres Sonnet. Mniej modeli do utrzymania, mniej logiki routingu, mniejsza zlozonosc operacyjna.
Dla polskiego rynku, gdzie agenci glosowi AI zyskuja na popularnosci w obsluce klienta, medycynie i uslugach profesjonalnych, ta kombinacja nizszego kosztu i wyzszej dokladnosci obniza prog wejscia. Polski rynek jest szczegolnie wrazliwy na cene, wiec 70% redukcja kosztow tokenow moze byc czynnikiem, ktory przekona firmy do wdrozenia AI w obsludze telefonicznej.
Adaptacyjne myslenie: model sam decyduje, jak gleboko myslec
Najbardziej interesujaca nowoscia techniczna Sonnet 4.6 jest adaptacyjne myslenie. Zamiast stosowac taki sam naklad obliczeniowy do kazdego zapytania, model dynamicznie decyduje, kiedy potrzebuje glebszego namyslu, a kiedy wystarczy szybka odpowiedz.
Proste pytanie o fakt dostaje bezposrednia odpowiedz. Zapytanie wymagajace wieloetapowego rozumowania, porownania lub syntezy uruchamia tryb rozszerzonego myslenia. Model pracuje krok po kroku, zanim sformuluje odpowiedz.
Dzieje sie to automatycznie. Nie trzeba konfigurowac poziomow wysitku ani budowac logiki routingu. Model czyta zapytanie i sam sie kalibruje.
W polaczeniu z oknem kontekstowym o pojemnosci 1 miliona tokenow, Sonnet 4.6 moze utrzymac w pamieci cala baze kodu, komplet dokumentow lub dluga historie rozmowy, jednoczesnie szybko odpowiadajac na proste pytania w ramach tego kontekstu.
Praktyczny efekt: szybkosc, kiedy mozna, glebokosc, kiedy trzeba. Bez dodatkowej konfiguracji po stronie programisty.
Wyszukiwanie w sieci i dynamiczne filtrowanie
Sonnet 4.6 wprowadza natywne narzedzia do wyszukiwania w sieci i pobierania stron. Model moze samodzielnie szukac w internecie, pobierac strony i stosowac dynamiczne filtrowanie, zeby wyciagnac dokladnie te informacje, ktorych potrzebuje.
Dynamiczne filtrowanie to kluczowy element. Zamiast ladowac cala strone internetowa do kontekstu (co marnuje tokeny i rozmywa skupienie), model filtruje pobrana tresc do odpowiednich sekcji przed przetworzeniem. Mniej tokenow, wyzsza dokladnosc.
Przyklad: ktos dzwoni do gabinetu lekarskiego i pyta o dostepne terminy w tym tygodniu. Jesli gabinet wlasnie zaktualizowal grafik na stronie, model moze pobrac aktualna informacje zamiast polegac na danych, ktore moga byc nieaktualne.
W Polsce, gdzie godziny otwarcia gabinetow, urzedow i firm czesto sie zmieniaja (szczegolnie w okolicach swiat i dlugich weekendow), ta mozliwosc eliminuje zrodlo bledow, z ktorym statyczne bazy wiedzy nie radza sobie dobrze.
Dlaczego modele sredniej klasy sa najwazniejsze dla AI telefonicznego
Rozmowy telefoniczne w czasie rzeczywistym stawiaja dwa sprzeczne wymagania. Model musi odpowiadac wystarczajaco szybko, zeby rozmowa brzmiala naturalnie (opoznienie mierzone w setkach milisekund). I musi byc wystarczajaco inteligentny, zeby rozumiec kontekst, radzic sobie z wieloznacznosciami i wyciagac wlasciwe informacje z tego, co mowi rozmowca.
Modele Opus radza sobie z czescia dotyczaca inteligencji, ale ich czasy odpowiedzi i koszty tokenow czynia je niepraktycznymi dla aplikacji glosowych o duzym wolumenie. Modele Haiku sa szybkie i tanie, ale gubig niuanse i popelniaja wiecej bledow w zlozonych rozmowach.
Sonnet trafia w punkt. A z wersja 4.6 ten punkt sie wyraznie poszerzyl.
Policzmy. Usluga AI telefonicznego przetwarzajaca 3.000 polaczen dziennie, ze srednia 2.000 tokenow na polaczenie, widzi bezposrednia redukcje zuzycia tokenow o 70%. Nagromadzone przez miesiace, te oszczednosci staja sie znaczace. W polskich realiach, gdzie marze w branzze uslugowej sa czesto waskie, ta roznica moze decydowac o oplacalnosci calego wdrozenia.
Poprawa dokladnosci ma rownig duze znaczenie. Kazde polaczenie, w ktorym AI zle rozumie rozmowce, generuje zgloszenie serwisowe, pominieta wizyte lub niezadowolonego klienta. Przy 38% wyzszej dokladnosci wskaznik bledow spada. Mniej bledow oznacza lepsza obsluge uzytkownika koncowego i mniej recznych poprawek.
Ulepszenia w zakresie kodowania, obslugi komputera i planowania agentow w Sonnet 4.6 pokazuja, gdzie Anthropic widzi ten model: w systemach produkcyjnych, w ktorych agenci AI dzialaja autonomicznie. AI telefoniczne pasuje do tego wzorca. Agent odbiera polaczenie, analizuje intencje, wyszukuje informacje, formuluje odpowiedz i uruchamia dzialania nastepczne. Wszystko w czasie rzeczywistym.
Dla firm budujacych rozwiazania oparte na glosowej sztucznej inteligencji, Sonnet 4.6 to rodzaj aktualizacji, ktora nie wymaga przebudowy architektury. Bezposrednia wymiana: wszystko dziala lepiej, kosztuje mniej i poprawnie obsluguje wiecej przypadkow brzegowych. To jest dokladnie to, czego zespoly produkcyjne potrzebuja.
Zrodla
- What’s New in Claude 4.6 - Anthropic
- Anthropic Releases Sonnet 4.6 - TechCrunch