Jaki jest limit tokenów ChatGPT i czy można go przekroczyć?

Czytelnicy tacy jak ty pomagają wspierać MUO. Kiedy dokonujesz zakupu za pomocą linków na naszej stronie, możemy otrzymać prowizję partnerską. Czytaj więcej.

ChatGPT szturmem podbił świat technologii i nie brakuje ulepszeń i aktualizacji. Ale pomimo zastosowania zaawansowanej technologii, w obecnej wersji istnieje sporo czynników ograniczających.

jak dodać homebrew do wii

Jednym z takich czynników jest system tokenów, który nadal przerywa cykl ewolucji, sprowadzając użyteczność aplikacji na kolana. Jeśli korzystasz z ChatGPT, możesz chcieć wiedzieć o tokenach ChatGPT i co zrobić, gdy zabraknie tokenów.

WYKORZYSTAJ WIDEO DNIA PRZEWIŃ, ABY KONTYNUOWAĆ TREŚĆ

Cofnijmy się o krok i dajmy wgląd we wszystko, co trzeba wiedzieć o podstawowych mechanizmach działania aplikacji.

Co to jest token ChatGPT?

Jeśli przejdziesz przez fasadę aplikacji, wszystko, co zobaczysz, to język komputerowy, który wykonuje twoje polecenia i udziela odpowiedzi, których szukasz. Jednak backend to tylko dużo kodu, uczenie się co minutę i nadążanie za pytaniami, na które odpowiada.

ChatGPT konwertuje każde słowo na czytelny token za każdym razem, gdy zadajesz pytanie. Mówiąc dalej, tokeny to fragmenty tekstu, a każdy język programowania używa innego zestawu wartości tokenów, aby zrozumieć wymagania.

Operatory porównania i logika boolowska z cpp

Ponieważ komputery nie rozumieją bezpośrednio wartości tekstowych, rozkładają je na kombinację liczb, często nazywaną osadzeniem. Możesz nawet rozważyć osadzenie, takie jak Listy Pythona , które przypominają listę powiązanych liczb, na przykład [1.1,2.1,3.1,4.1…n].

Gdy ChatGPT pobierze początkowe dane wejściowe, próbuje przewidzieć następne możliwe dane wejściowe na podstawie poprzednich informacji. Wybiera całą listę wcześniejszych tokenów i, używając swojej syntezy kodowania, próbuje uprzedzić kolejne dane wprowadzone przez użytkownika. Wykorzystuje i przewiduje jeden token na raz, aby ułatwić językowi zrozumienie użycia.

czy ps5 ma zestaw słuchawkowy?

Aby udoskonalić przewidywania i poprawić dokładność, pobiera całą listę osadzeń i przekazuje ją przez warstwy transformatora w celu ustalenia powiązań między słowami. Na przykład, gdy zadasz pytanie typu „Kim jest Thomas Edison?”, ChatGPT wybiera najcenniejsze słowa z listy: Kto I Edison .

Warstwy transformatora mają swoją rolę do odegrania w całym procesie. Warstwy te są formą architektury sieci neuronowej wyszkolonej do wybierania najbardziej odpowiednich słów kluczowych z ciągu słów. Jednak proces uczenia nie jest tak prosty, jak się wydaje, ponieważ trenowanie warstw transformatora na gigabajtach danych zajmuje dużo czasu.

Chociaż ChatGPT przewiduje tylko jeden token na raz, jego technologia autoregresji jest zaprogramowana do przewidywania i przekazywania informacji zwrotnej do modelu podstawowego w celu uwolnienia danych wyjściowych. Model jest dostrojony do uruchamiania tylko raz dla każdego żetonu, więc wynik jest drukowany po jednym słowie na raz. Dane wyjściowe są zatrzymywane automatycznie, gdy aplikacja napotyka polecenie zatrzymania tokenu.

Na przykład, jeśli spojrzysz na kalkulator tokenów na stronie ChatGPT, możesz obliczyć wykorzystanie tokena na podstawie swoich pytań.

Wprowadźmy przykładowy tekst, na przykład:

jak ustawić marginesy w dokumentach google

 How do I explain the use of tokens in ChatGPT?

Według kalkulatora w tym ciągu jest 46 znaków, co pochłonie 13 tokenów. Jeśli podzielisz to na identyfikatory tokenów, wygląda to mniej więcej tak:

 [2437, 466, 314, 4727, 262, 779, 286, 16326, 287, 24101, 38, 11571, 30]

Obliczenia tokenizera z OpenAI's website

Zgodnie z Kalkulator tokenów OpenAI :