No momento, você está visualizando DeepSeek: conheça a nova inteligência artificial chinesa

DeepSeek: conheça a nova inteligência artificial chinesa

A Deepseek, uma inteligência artificial chinesa foi criada por Liang Wengfeng. Ele é o fundador da startup que possui o mesmo nome e acredita que o mundo pode ser transformado pela IA.

Esse chatbot fez as grandes empresas de tecnologia perderem por volta de US$1 trilhão em valor no final de janeiro de 2025.

Dessa forma, Liang abalou a liderança das grandes empresas de tecnologia do Vale do Silício dos EUA e atraiu a atenção dos especialistas devido ao seu chatbot ter ultrapassado o ChatGPT que é americano.

Ele passou a ser o aplicativo mais baixado na loja da Apple dos EUA e o programa gratuito mais baixado nos Estados Unidos e na China.

Ele também impressionou por ser bem mais barato do que as outras inteligências artificiais que já estão consolidadas no mercado.

Isso fez com que as ações das principais empresas de tecnologia americanas caíssem muito, pois os investidores começaram a vender rapidamente as suas ações das empresas americanas. Ele surpreendeu não apenas o mercado americano, mas também o europeu.

O modelo DeepSeek-R1, lançado recentemente pela startup chinesa, possui código aberto e consegue um desempenho parecido com a Open AI-o1,  porém com custos reduzidos entre 3% e 5% do valor operacional dos modelos líderes do mercado.

O aplicativo pode ser baixado na Play Store ou na Apple Store desde 10 de janeiro e para utilizá-lo é necessário apenas criar uma conta.

Um outro ponto a ser considerado como responsável pelo sucesso dessa IA é a “esparsidade” que seria resumidamente extrair mais dos chips de computador. Envolvendo, às vezes eliminar partes dos dados usados pela IA quando eles não afetam materialmente o resultado do modelo. Outras vezes, envolve cortar partes de uma rede neural, se isso não afetar o resultado final.

Uma das vantagens dessa IA é como ela trabalha com os parâmetros. Os parâmetros moldam como um comando dado para uma IA pode se transformar em um texto ou imagem e a DeepSeek consegue ligar e desligar grandes seções dos “pesos” ou “parâmetros” de uma rede neural.

Outro avanço que esse chatbot apresenta é que ele utiliza a “atenção latente multi-cabeça” que comprime um dos maiores consumidores de memória e largura de banda: o cache de memória que mantém o texto mais recente de um prompt, conforme explicado no Epoch AI.

Dessa forma, ao desligar partes da rede neural é possível conseguir um resultado igual ou superior com um poder computacional menor.

Observou-se, entretanto, que a DeepSeek, pelo menos durante a semana do seu lançamento, apresentou problemas para responder perguntas sobre questões polêmicas que envolvem a China, como o Massacre na Praça Celestial. Outra situação que chamou atenção é que as pessoas enfrentaram dificuldades para se cadastrar no chatbot.

É importante lembrar que a inteligência artificial ainda vai avançar muito e há muitas empresas trabalhando com diferentes ferramentas e agora com a DeepSeek sabe-se que é possível desenvolver uma IA gastando muito menos do que se tinha ideia até o momento.

Muito em breve outras irão surgir no mercado e no futuro veremos quais irão permanecer.

Clique aqui, inscreva-se no blog da Super TI 360 e fique por dentro das notícias sobre tecnologia!

 

CLIQUE AQUI E FALE CONOSCO

logotipo_superti360