Mistral AI wydała nowe narzędzia — Codestral Mamba i MathΣtral

Mistral AI wydała nowe narzędzia — Codestral Mamba i MathΣtral

Mistral AI zaprezentowało dwa nowe produkty rozszerzające możliwości sztucznej inteligencji, w tym MathΣtral — wyspecjalizowany model do obliczeń matematycznych i badań naukowych, oraz Codestral Mamba — modele z otwartym kodem źródłowym do generowania kodu.

Codestral Mamba

Codestral Mamba to model 7B, który oferuje możliwość kontekstowego wyszukiwania do 256K tokenów. Specjalizuje się w generowaniu kodu i jest dostępny na licencji Apache 2.0. Obsługuje języki programowania takie jak Python, Java, JavaScript, C, C++, Swift, Fortran i Bash.

Modele Mamba mają zaletę liniowego czasu odpowiedzi i teoretyczną możliwość modelowania sekwencji o nieskończonej długości. Dzięki temu użytkownicy mogą otrzymywać szybkie odpowiedzi, niezależnie od długości danych wejściowych.

Codestral Mamba można wdrożyć za pomocą mistral-inference SDK, który opiera się na referencyjnych implementacjach z repozytorium Mamba na GitHubie. Model można również wdrożyć za pomocą TensorRT-LLM lub pobrać surowe wagi z HuggingFace.

MathΣtral

Dla wygody testowania, Codestral Mamba jest dostępna na platformie La Plateforme (codestral-mamba-2407), obok swojej „starszej siostry”, Codestral 22B.

To specyficzny model 7B, przeznaczony do rozwiązywania problemów matematycznych oraz odkryć naukowych. Model ma 32K okno kontekstowe i jest udostępniony na licencji Apache 2.0.

Osiąga najnowocześniejsze w swojej kategorii rozmiarowej możliwości obliczeniowe w różnych standardowych testach branżowych (osiąga 56,6% w MATH oraz 63,47% w MMLU).

Współczynniki wag są umieszczone na HuggingFace. Mathstral można wypróbować za pomocą mistral-inference i dostosować za pomocą mistral-finetune.

MathΣtral jest dostępna do użytku i adaptacji za pomocą narzędzi Mistral AI.

Avatar
Jun 26, 2023

Why Developers Should Participate in Hackathons

Over the last year, as a part of the team, I’ve won two hackathons: the National Defence Hackathon and the TIDE NATO Hackathon in Warsaw. In this article, I want to share our experience and shed light on why hackathons are useful for developers not only in terms of skills development and search for new tech solutions but also why it is important to use all opportunities to help develop the brand of Ukraine on the international level and strengthen national security using technologies.
0
Oct 29, 2024

Porównywarka cen pozwała Google do sądu i wygrała. Google zapłaci grzywnę w wysokości 2,4 miliarda euro

Google przez siedem lat walczyło z werdyktem wydanym w czerwcu 2017 roku, ale we wrześniu tego roku najwyższy sąd w Europie – Trybunał Sprawiedliwości Unii Europejskiej – odrzucił jego apelacje.
0
Nov 10, 2022

Sytuacja na rynku Venture Capital i zakładanie startupów w Polsce: najważniejsze aspekty prawne

Jak wygląda sytuacja rynkowa startupów technologicznych w Polsce? O czym warto pamiętać otwierając startup w Polsce i jakie formy działalności są dostępne dla polskich i zagranicznych founderów ?
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies