Fala Gaiotto - A Inteligência Artificial e a Cultura Open-Source (um caso prático com OpenWebUi e DeepSeek.R1)

Para pessoas que veem o desempenho do DeepSeek e pensam: “A China está superando os EUA em IA”. Você está lendo errado. A leitura correta é: “Os modelos de código aberto estão superando os proprietários.”, por Yann LeCun.

Bem-viiindos! O ano mal começou e cá estou, presenciando e podendo relatar sobre fatos e seus potencializadores que ficarão marcados na história. Seguindo o conteúdo de nossa coluna ligado a IA, destaco o ocorrido em 27 de janeiro de 2025, onde a Nasdaq e S&P 500 registram quedas nas ações de tecnologia sob pressão do DeepSeek (Reuters). E com isso, me peguei refletindo e perguntando:

O quanto este acontecimento irá furar a bolha da IA e impactar o público geral?
E quais serão os desdobramentos?

Infelizmente, por enquanto, estou longe de conseguir responder a essas perguntas, mas quero aproveitar o momento e exemplificar na prática a afirmação acima,👆 de Yann LeCun, atual Chief AI Scientist na Meta, em destaque na página.

“Senta que lá vem a história”

Atuo com inteligência de dados desde 2005. Foi nessa época que desenvolvi meus primeiros modelos de dados em star schema, apoiei na definição e construção de métricas e indicadores e a chegar até a fase de implantação dos dashboards na ferramenta para apresentação de KPI da época – Panorana e homologar seu uso no dia a dia.

Apliquei com profundidade Business Intelligence (BI), aprendendo na prática a importância de medir para gerenciar e vivenciando o conceito de gestão à vista.

Em termos gerais, pude participar ativamente no desenvolvimento das soluções que apoiaram o lançamento e operação do cartão de crédito do banco e financeira do grupo Votorantim.

Anos depois, pude apreciar a publicação da Harvard Business Review que trouxe uma afirmação que me tocou: Cientista de Dados: O trabalho mais “sexy” do século 21 (HBR). Certamente essa foi uma das leituras que mais influenciou na direção que dei em minha carreira.

E foi então que comecei a me aprofundar no maravilhoso mundo do open-source. Primeiro comecei a estudar sobre scikit-learn, biblioteca machine learning (ML) ou aprendizado de máquina, disponível para a linguagem de programação Python. Na sequência, caí no mundo do big data, representado tecnicamente pelo instituto Apache, com sua distribuição Hadoop onde pude conhecer e testar a “opção” ao scikit-learn, o framework Apache Mahout.

Filosofia Open-Source não é sobre ser “grátis”

Para começar a destilar sobre a filosofia do open-source, quero citar Henry Chesbrough (2003), autor do livro Open Innovation – The New Imperative for Creating and Profiting from Technology, que trata sobre:

A inovação além das fronteiras internas das organizações privadas/fechadas;
A Inovação que não deve depender apenas de ideias e tecnologias desenvolvidas internamente, mas integrar conhecimentos externos/abertos a partir de startups, universidades, concorrentes, comunidades open-source, etc.
A colaboração é apresentada como motor para a aceleração da inovação por parcerias, licenciamento de tecnologias, compartilhamento de dados e modelos de negócio baseados em ecossistemas abertos. Já a cultura de compartilhamento leva geração de mais valor para as empresas e nações que adotam práticas abertas (como ciência aberta ou projetos colaborativos globais), permitindo que se adaptem mais rapidamente a mudanças.

Citando dois casos recentes de compartilhamento de conhecimento e como a colaboração gera resultados melhores e mais rápidos, a exemplo do:

CERN (Grande Colisor de Hádrons) tem a tradição de disseminar o conhecimento e compartilhar a tecnologia. Com mais de 30 mil colaboradores de diversas nações, sendo grande parte físicos, técnicos e engenheiros tiveram formação no Cern, atuando com o colisor de partículas;
Desenvolvimento de vacinas durante a COVID-19, podendo citar a parceria Pfizer-BioNTech, que viabilizou a abertura de dados genéticos do vírus para o desenvolvimento acelerado de vacinas por concorrentes e países.

“E a IA com isso!?”, eu te digo! Você sabe qual a parte mais sensível do “corpo” e que pode colocar o DeepSeek em primeiro lugar na AppleStore em vários países? Se você respondeu: o bolso, você acertou. Na última semana de jan/2025, o ChatGPT-o1 custava US$ 15 para cada milhão de input tokens (perguntas ou solicitações feitas para a IA). Em contrapartida, o DeepSeek-R1 custava US$ 0,55.

Mas e se eu te disser que pode ser ainda mais barato usar o DeepSeek ou qualquer outro modelo de linguagem open-source e de uso gratuito!?

Neste caso, isso significa poder executar e usá-los a partir de uma instalação no computador pessoal ou profissional (desde que a política da empresa proprietária do computador o permita) e sem conexão com internet.

Caso prático e possivelmente viável para muitos

Vou compartilhar minha saga no mundo maravilhoso do open-source, onde meu foco foi instalar e usar o modelo DeepSeek-r1:7b de 7 bilhões de parâmetros. Para aqueles que estão com o espírito aventureiro ativado, farei um “step-by-step” para algumas etapas.

Comecei entendendo qual configuração do meu computador pessoal, sendo:

Laptop, com processador Intel i7, 512Gb de disco local (SSD), 16gb de RAM e uma placa de vídeo Nvidia GeForce MX450.

Na sequência, defini qual o serviço de distribuição do modelo de linguagem DeepSeek-r1 eu iria utilizar. Para este caso eu escolhi o ollama.com.

A Inteligência Artificial e a Cultura Open-Source (um caso prático com OpenWebUi e DeepSeek.R1)

Figura 1: tela inicial do ollama, que destaca o modelo DeepSeek-r1 como uma das opções de modelo de linguagem para download.

Ao clicar em download, escolhi o arquivo para instalação de acordo com o sistema operacional que tenho instalado, sendo neste caso o Sistema Operacional Windows 11 Home Single Language.

Uma vez instalado o ollama, é possível ver na área do relógio seu ícone (canto inferior direito da tela).

Como próximo passo, pressionei as teclas “windows” e a letra “R”, nesta sequência. Foi então, aberta uma tela chamada “Executar”. No espaço para texto, escrevi “cmd” e acionei o botão OK. Com a tela de command prompt aberta, escrevi o comando “ollama list”, para listagem dos modelos de linguagem anteriormente instalados no meu computador, conforme abaixo:

Figura 2: resultado de saída do comando “ollama list”, com os modelos de linguagens instalados no meu computador. Como já tenho alguns modelos instalados, a minha lista é maior. Provavelmente você verá um resultado em branco, sem modelos.

Para instalar o modelo de linguagem DeepSeek-r7:7b e executar diretamente pela tela de command prompt, digitei o comando “ollama run DeepSeek-r1:7b”. Para interagir com o DeepSeek, escrevi um prompt de entrada logo após os símbolos “>>>”, sendo neste caso: “quero que você explane sobre a cultura open-source”, e então pressionei o “Enter”:

Figuras 3 e 4: fragmentos do resultado de reasoning (raciocínio) obtido com base no prompt informado. Observe que o prompt de saída, ou seja, a resposta que o modelo DeepSeek gerou foi em inglês, possivelmente por estar entre os principais idiomas, juntamente com chinês, usados no treinamento do modelo. Isso também pode ter acontecido por eu não ter informado o idioma que eu esperava como saída.

Anos atrás, em tempos mais restritivos, em se falando de soluções open-source, eu me daria por satisfeito. Sendo assim, resolvi incrementar um pouco mais minha experiência com o uso de modelo de linguagem.

A interface de uso que tenho como referência é o ChatGPT, logo eu queria algo minimamente parecido. Foi quando, em março/2024 encontrei o Open-WebUI.

O Open-WebUI é uma plataforma de IA que pode ser instalada e executada diretamente pelo computador local. É extensível, rica em recursos e fácil de usar, projetada para operar totalmente off-line. Suporta várias distribuições de LLM, como ollama e APIs compatíveis com OpenAI, além disso, oferece mecanismos de inferência integrado para RAG (retrieval-augmented generation), o que particularmente vem sendo uma excelente plataforma de uso e playground.

Antes de descrever como realizar sua instalação, quero destacar, sobre o que entendo ser um dos maiores diferenciais do Open-WebUI e estar alinhado com a cultura open-source. Estou falando sobre sua plataforma de extensibilidade, acessível pelo site https://openwebui.com/.

Figura 5: plataforma social gratuita para avaliação e auditoria de LLMs, onde os usuários interagem com a interface de usuário de código aberto. Maiores informações, consulte o whitepaper.

A plataforma OpenWebUi permite a criação de um ecossistema de avaliação centrado na comunidade, construída com base nos princípios da colaboração, aprendizado compartilhado e benefício mútuo.

Traz consigo elementos de gamificação que podem aumentar o envolvimento do usuário, com a incorporação de elementos como emblemas, tabelas de classificação ou pontos para colaboradores ativos, o que pode criar uma experiência mais envolvente e gratificante.

Visa facilitar a aprendizagem, compartilhamento e melhores práticas entre os usuários, bem como descobertas interessantes e prompts personalizados, que podem promover um ambiente de aprendizado dentro da comunidade, potencializando estratégias eficazes para um engajamento sustentável.

– Informações para instalação e uso do Open-WebUi

Como pré-requisito foi necessário realizar a instalação da linguagem de programação Python;

Python 3.11 ou superior: https://www.python.org/downloads/release/python-3111/

Após a instalação, eu abri novamente o command prompt, para reproduzir os comandos abaixo:

Figura 6: primeiro instalei a biblioteca/aplicação usando o comando “pip install open-webui” e posteriormente executei a aplicação usando o comando “open-webui serve”.

Uma vez concluída a instalação, eu abri meu navegador e digitei http://localhost:8080/ - somente disponível em minha ou sua máquina local. E não é que, a partir daí, passei ter meu quase “ChatGPT”!?

Figura 7: tela inicial do Open-WebUi instalado localmente no meu computador.

A partir daqui, é seguir o instinto de experimentação e começar a compreender do que essa plataforma e o modelo de linguagem DeepSeek-r7:7b, são capazes.

Um primeiro passo foi selecionar o modelo de linguagem no canto superior esquerdo, clicando na cortina de opções e torná-lo meu modelo de uso padrão, clicando no “Set as Default” ou “Escolha como Padrão”.

Antes de iniciar os testes, vale lembrar que estamos falando de um modelo de linguagem para raciocínio (reasoning) que conta com maior orientação a resolver desafios, ao invés de modelo de linguagem diretamente ligado a derivação de conteúdo, mais usado comumente no dia a dia.

Dado essa característica, eu propus 5 perguntas sobre lógica, sendo:

Sequência Numérica: Identifique o próximo número na sequência: 2, 10, 12, 16, 17, 18, 19, ?
Problema de Lógica: Em uma sala quadrada, há um gato em cada canto. Cada gato vê três gatos. Quantos gatos há na sala?
Charada Matemática: Uma garrafa com sua rolha custa R$ 1,10. Sabendo que a garrafa custa R$ 1,00 a mais que a rolha, qual é o preço da rolha?
Desafio de Pensamento Lateral: Uma mulher tem 8 filhos: metade são meninos. Como isso é possível?
Problema Clássico: Três gatos pegam três ratos em três minutos. Quanto tempo levarão 100 gatos para pegar 100 ratos?

Figura 8: observe que o modelo levou 2 minutos “pensando”.

Quando cliquei na cortina .

Pude ter acesso ao Chain-of-Thought (CoT) Prompting ou Cadeia de Pensamentos da Solicitação, que é a base para o raciocínio do modelo de linguagem e que o permite elaborar e chegar até a resposta, como demonstrado abaixo para a primeira pergunta:

Figura 9: Chain-of-Thought (CoT) Prompting.

A pergunta se remete ao conhecimento da língua portuguesa, que escolhi a dedo para testar a lógica que o DeepSeek-r1:7b poderia ter adotado, mas ele errou.

A lógica a ser adotada deveria ser a seguinte:

2: dois (inicia com D)
10: dez (D)
12: doze (D)
16: dezesseis (D)
17: dezessete (D)
18: dezoito (D)
19: dezenove (D)

Logo, a resposta certa é 200: duzentos (D)

Para as demais perguntas o desempenho foi satisfatório, gerando um CoT interessante e acertando as respostas. E quer saber? Eu gostei!

De modo geral, eu avalio como muito bom! E sabe o porquê? Porque:

Mesmo sendo um modelo de linguagem pré-treinado (DeepSeek-r1:7B) com capacidade reduzida e poderoso o suficiente, mesmo instalado em um computador local, isso ainda foi o suficiente para concorrer com outros modelos de linguagem open-source e gratuitos, e guardadas as devidas proporções, conseguiu competir com grandes empresas privadas de mercado;
Ahhh, vale ponderar que para essa última afirmação, parto do princípio de que dificultei o trabalho do DeepSeek-r1, pois ofereci apenas um zero-shot prompt ínfimo e propositalmente ambíguo.

Sobre a conexão com a Cultura Open-Source

E quanto a cultura open-source?

Posso afirmar que toda a jornada que relatei até aqui, somente foi possível, pois pessoas de maneira independente e instituições escolheram contribuir com o open-source, seja por melhorar soluções existentes ou por contribuir com novas soluções. Como critério de sucesso, posso destacar que:

consegui interagir de maneira simples e acessível, usando uma solução open-source (Open-WebUi);
ambas as iniciativas – OpenWebUi e DeepSeek-r1 – estão em seu nascedouro, tem menos de 1 ano de existência, o que me gera uma baita expectativa para as próximas versões e seus a possibilidade de muito mais opções open-source;
quando para avaliar os resultados e percebo que isso é o “pior” que podem fazer, até agora, fico entusiasmado pelo que vem pela frente.

Além disso, penso ser interessante revisitar Chesbrough e sua teoria apresentada no Open Innovation, a luz em como entender o quanto se alinha com os princípios do open-source, citando:

compartilhamento livre de conhecimento, com o código-fonte aberto, documentação acessível e colaboração descentralizada;
inovação coletiva, podendo listar projetos como Linux, Apache, e Python, que são resultados diretos de contribuições globais e iterativas;
redução de assimetrias tecnológicas em países e empresas, com o desenvolvimento mais rápido ao utilizar e adaptar tecnologias open-source, a exemplo de Índia e Brasil, que usam soluções open-source em políticas públicas para TI.

Por fim, e você, qual sua avaliação quanto a todo esse cenário? Seja pelo modelo de linguagem ou pela oportunidade de potencializar a cultura open-source?