[NEW] Search for a job anonymously — check the details
Close
Mistral AI wydała nowe narzędzia — Codestral Mamba i MathΣtral

Mistral AI wydała nowe narzędzia — Codestral Mamba i MathΣtral

Mistral AI zaprezentowało dwa nowe produkty rozszerzające możliwości sztucznej inteligencji, w tym MathΣtral — wyspecjalizowany model do obliczeń matematycznych i badań naukowych, oraz Codestral Mamba — modele z otwartym kodem źródłowym do generowania kodu.

Codestral Mamba

Codestral Mamba to model 7B, który oferuje możliwość kontekstowego wyszukiwania do 256K tokenów. Specjalizuje się w generowaniu kodu i jest dostępny na licencji Apache 2.0. Obsługuje języki programowania takie jak Python, Java, JavaScript, C, C++, Swift, Fortran i Bash.

Modele Mamba mają zaletę liniowego czasu odpowiedzi i teoretyczną możliwość modelowania sekwencji o nieskończonej długości. Dzięki temu użytkownicy mogą otrzymywać szybkie odpowiedzi, niezależnie od długości danych wejściowych.

Codestral Mamba można wdrożyć za pomocą mistral-inference SDK, który opiera się na referencyjnych implementacjach z repozytorium Mamba na GitHubie. Model można również wdrożyć za pomocą TensorRT-LLM lub pobrać surowe wagi z HuggingFace.

MathΣtral

Dla wygody testowania, Codestral Mamba jest dostępna na platformie La Plateforme (codestral-mamba-2407), obok swojej „starszej siostry”, Codestral 22B.

To specyficzny model 7B, przeznaczony do rozwiązywania problemów matematycznych oraz odkryć naukowych. Model ma 32K okno kontekstowe i jest udostępniony na licencji Apache 2.0.

Osiąga najnowocześniejsze w swojej kategorii rozmiarowej możliwości obliczeniowe w różnych standardowych testach branżowych (osiąga 56,6% w MATH oraz 63,47% w MMLU).

Współczynniki wag są umieszczone na HuggingFace. Mathstral można wypróbować za pomocą mistral-inference i dostosować za pomocą mistral-finetune.

MathΣtral jest dostępna do użytku i adaptacji za pomocą narzędzi Mistral AI.

Avatar
Jun 26, 2023
Why Developers Should Participate in Hackathons
Over the last year, as a part of the team, I’ve won two hackathons: the National Defence Hackathon and the TIDE NATO Hackathon in Warsaw. In this article, I want to share our experience and shed light on why hackathons are useful for developers not only in terms of skills development and search for new tech solutions but also why it is important to use all opportunities to help develop the brand of Ukraine on the international level and strengthen national security using technologies.
Dec 4
CEO Intela odchodzi, firma poszukuje nowego kandydata
Intel ogłosił, że CEO Pat Gelsinger zrezygnował ze stanowiska po trudnym okresie w firmie. Dawny gigant rynku procesorów, którego akcje gwałtownie spadły, przegapił boom na AI i został wyprzedzony przez większość swoich konkurentów.
May 20
Jak wygląda praca testerki gier we własnej firmie i czego oczekiwać od największej konferencji gamingowej w San Francisco
W wiek 24 lata Weronika Furtak prowadzi firmę zajmującą się testowaniem gier, odwiedziła Game developers conference w San Francisco i niedługo wybiera się na Digital Dragons w Krakowie.W gry komputerowe grała z tatą od małego. Teraz wśród ulubionych wymienia “World of warcraft”, cała seria “Mario”, “Portal”, czy nowe indie gry jak "Stray”.

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies