No fértil terreno encontrado pela inteligência artificial (IA) do tipo geradora de conteúdo nos últimos meses, empresas chinesas têm sido praticamente as únicas a fazer alguma frente à predominância das big tech dos EUA. Uma série de anúncios de sistemas chineses voltados à linguagem marca uma resposta na corrida que ganhou destaque com o lançamento do ChatGPT, no final do ano passado.
Por mais que existam nomes de destaque em outras localidades, é do setor privado desses dois países que têm surgido boa parte das principais novidades recentes. Publicamente, as empresas chinesas apertaram o passo desde março, e nomes como Alibaba, Baidu, Huawei e Tencent divulgaram perspectivas de lançamentos ou aprimoramentos em suas versões dos chamados grandes modelos de linguagem –rivais do GPT, o motor do sistema da americana OpenAI.

Trata-se de inteligências artificiais focadas em conteúdo textual: podem processar a comunicação escrita, responder perguntas, montar sequências de frases que parecem ter sido feitas por humanos, fazer traduções e gerar códigos de programação. Apesar de nuances na arquitetura dos algoritmos, as versões apresentadas por essas empresas chinesas têm estrutura semelhante àquelas de nomes como Google, Meta (Facebook) e Microsoft, e as tarefas desempenhadas são, em essência, as mesmas.
Relatório encabeçado pela Universidade Stanford (EUA) lançado no início de abril destaca a participação de ambos os países no setor.
E não só competindo. De acordo com o documento, a ponte entre China e Estados Unidos foi a líder nas colaborações entre nações para a produção de artigos científicos sobre IA na última década, por mais que o crescimento anual da parceria venha desacelerando.
“Apesar de EUA e China continuarem a dominar a área de pesquisa e desenvolvimento de IA, os esforços estão se diversificando geograficamente”, ressalva o relatório, que teve apoio de empresas como Google, OpenAI, Linkedin e Github, as três últimas ligadas à Microsoft. A participação da Índia em estudos especializados, por exemplo, vem crescendo. O documento, no entanto, destaca a dianteira chinesa nas produções acadêmicas sobre IA, enquanto os EUA lideram no quesito investimento com, US$ 47,4 bilhões (cerca de R$ 234 bilhões) em 2022 ante US$ 13,4 bilhões (R$ 66 bilhões) da segunda colocada China.
Uma comparação entre os resultados práticos desse dinheiro gasto não é tarefa simples, primeiro devido à disponibilidade: apesar de anunciadas, as versões mais atuais desses sistemas não são de fácil acesso ao público. Além das comunicações oficiais das empresas, é possível apenas analisar documentos que acompanham algumas dessas tecnologias, com informações técnicas sobre sua estrutura e desempenho.
O rebuliço causado pelo ChatGPT, que conquistou a marca recorde de 100 milhões de usuários dois meses após seu lançamento, exigiu uma resposta rápida de concorrentes que não necessariamente tinham produtos no mesmo grau de maturidade, como o Ernie Bot, considerado um dos mais avançados na China.
O robô da Baidu, empresa especializada em buscas, tem formato de conversas à la Bing (Microsoft), que tem o GPT por baixo dos panos. A ferramenta propõe funcionalidades semelhantes, além de geração de imagens e fala, como demonstrado em vídeos. Hoje só pode ser acessado por meio de convites seletos.
O Ernie também mostra que o valor gasto não conta toda a história. O relatório de Stanford coloca a produção de sua versão 3.0, lançada em 2021 e uma das bases do Bot, como cerca de cinco vezes mais barata do que a do GPT-2, de 2019, e 180 vezes mais barata que a do GPT-3, de 2020. No geral, o gasto tem subido ao longo do tempo. Para redução de custos, os artigos técnicos da Baidu citam um conjunto de técnicas propostas por pesquisadores da Universidade Tsinghua, baseada em Pequim
.
Impor limites para o comportamento das IAs é uma dificuldade enfrentada pelo setor como um todo. A principal diferença é no rigor da linha traçada, mais estrita no caso chinês.
Os termos de uso do GLM-130B, modelo especializado em inglês e chinês lançado pela Universidade Tsinghua em 2022, incluem restrições para aplicações que minem o governo do país. “Você não usará este software para qualquer ação que possa minar a segurança ou unidade nacionais da China, prejudicar o interesse público da sociedade ou infringir direitos e interesses de seres humanos”, diz trecho da licença.
Nos EUA, os termos de uso não fazem referência a segurança nacional ou interesses do país, mas, para os sistemas criados por empresas como Google e Microsoft, o desafio de limitar as respostas surge ao tentar evitar que as ferramentas falem abobrinhas ou forneçam, por exemplo, orientações para criar armas químicas. A China também responsabiliza os criadores dos algoritmos, que deverão fornecer os detalhes de seus sistemas para um registro estatal, por eventuais conteúdos inapropriados gerados.
A dificuldade de manter o conteúdo dentro das linhas impostas pelo regime chinês já levou à suspensão de outras tecnologias semelhantes, mesmo as projetadas no próprio país, onde conteúdos da internet com temas considerados sensíveis pelo governo são barrados. O ChatGPT também não funciona por lá.
Como os grandes modelos de linguagem são gerados ao analisar bilhões de textos, em que a IA detecta padrões e passa a reproduzi-los, uma alternativa pode ser limitar a informação que alimenta os robôs, embora essa filtragem traga desafios. Como o conteúdo é volumoso, é difícil descartar tudo o que pode ser problemático, e adotar um conjunto já previamente censurado, por outro lado, pode reduzir demais a quantidade de entradas para o modelo, derrubando seu desempenho.
Assim como a OpenAI, a Baidu não esclarece que dados usou para montar seu software mais moderno. A revista Wired especula que o conteúdo veio da internet chinesa, ou seja, com limitações devido à censura.
Nesses sistemas, num primeiro momento, tudo o que é absorvido está para jogo, incluindo conteúdos perigosos, imprecisos ou eticamente reprováveis. Na sequência, inicia-se um outro processo de treinamento com humanos para definir o que o robô pode ou não dizer. Nada disso é 100% eficaz.
Na prática, após testar o Ernie, jornais como The Washington Post e Nikkei Asia relataram uma experiência menos fluída do que com o GPT. Em partes, pelas restrições impostas pelo governo chinês. Ao ser questionado sobre o líder do país, Xi Jinping, o sistema afirma ser um robô que ainda está aprendendo e, na sequência, força o recomeço da conversa, relata a publicação americana.
Além do direcionamento fornecido por humanos, os pesquisadores da Baidu dizem que também conseguiram melhorias na qualidade das informações ao incluir uma camada de “conhecimentos” factuais para o robô. Assim, o Ernie obteve resultados expressivos em testes de referência.
Só que ele não está sozinho. Nesses ensaios, as ferramentas são submetidas a tarefas padronizadas para medir seu desempenho. Um robô que classifica imagens, por exemplo, analisa um conjunto de fotos catalogadas por humanos para ver o quanto acerta -na prática, as missões são bem mais complexas.
É o que possibilita algum tipo de comparação entre os sistemas, mas isso só vai até a página dois. De acordo com os pesquisadores de Stanford, essas referências estão ficando saturadas: após avanços a galope registrados ano a ano há até pouco tempo, há hoje pouquíssimo avanço no desempenho a cada lançamento porque as medidas não foram feitas para comportar as tecnologias atuais.
No fim, muitas dessas ferramentas podem alardear resultados expressivos em algumas das principais referências usadas hoje. E fica em aberto onde exatamente estão as falhas de cada um. O Ernie 3.0 chegou a liderar o SuperGLUE, conjunto de testes para robôs focados em linguagem criado em 2019 por pesquisadores das universidades Nova York e Washington, do Facebook, da Deepmind e da Samsung.
Agora, o modelo da Baidu é o quarto colocado na lista liderada pelo Vega, da varejista chinesa JD.
Não trata-se, porém, de uma métrica geral das melhores IAs. É uma medida entre várias disponíveis, e alguns concorrentes de peso, entre os quais o GPT-4, nem sequer foram oficialmente aferidos nessa régua. Sem contar que os sistemas podem ter versões otimizadas para se dar melhor em determinadas provas.
A ferramenta da OpenAI é destaque retumbante em uma série de outros testes. Lidera um bastante popular no setor, o MMLU. Numa comparação direta, um estudo feito por pesquisadores da universidade Hainan (China) -ainda não publicado oficialmente e sem revisão por pares– analisa GPT-4, Ernie e Tongyi Qianwen (Alibaba). Com uma bateria de tarefas feitas para entender o desempenho dos sistemas ao extrair e interpretar informações, a conclusão é a de que o modelo da OpenAI é o mais maduro.
RAPHAEL HERNANDES
SÃO PAULO, SP (FOLHAPRESS)