Local

Aposta de US$ 2,3 bilhões da General Intuition de que os videogames podem treinar agentes de IA para o mundo real


Assim que entrei no andar de P&D da General Intuition em seus escritórios de Nova York, o cofundador e CEO da empresa, Pim de Witte, de 31 anos, dirigiu minha atenção para um monitor empoleirado em uma mesa vertical. Alguém parece estar jogando algo como Fortnite. Não é uma pessoa.

“Nossos agentes jogam há 100 horas seguidas”, disse Kent Rollins, diretor de produtos da empresa, com um sorriso.

Antes de me concentrar em observar a IA navegar no ambiente virtual do jogo, ouvi os passos eletrônicos de um grande robô de quatro patas se aproximando.

“O mesmo cérebro que impulsiona o agente no jogo também impulsiona o robô”, disse-me de Witte. Josh Duplantis, analista de dados que carrega um laptop que transmite transmissões ao vivo da única câmera do robô, explicou que o modo padrão do bot é “exploração”.

Confiando naquela câmera, seu único olho, o robô gigante parecido com um inseto caminhou em minha direção, circulou ao meu redor e continuou seu caminho para o escritório. Às vezes, as pernas das cadeiras ficam presas ou esbarradas em latas de lixo, como uma criança que ainda não aprendeu como seu corpo se relaciona com o mundo ao seu redor. Duplantis disse que foram necessários apenas oito minutos de dados robóticos do mundo real para aperfeiçoar o modelo de IA para quadrúpedes. Além do mais, os dados são coletados na estrada, e não dentro do escritório onde o bot está navegando.

Um modelo de agente que pode generalizar desde a jogabilidade, simulação até a realização é a principal razão da Intuição Geral. E a capacidade da modelo de conhecer seu lugar no mundo lhe rendeu o apoio de diversas pessoas de sucesso.

Na quinta-feira, a General Intuition disse que levantou US$ 320 milhões em uma avaliação de US$ 2,3 bilhões, confirmando um relatório anterior do TechCrunch. A rodada eleva o total de financiamento divulgado da General Intuition para US$ 454 milhões, após uma rodada de US$ 134 milhões arrecadada no lançamento em outubro passado.

A startup foi desmembrada de outra empresa de De Witte, a Medal, que permitia aos jogadores fazer upload e compartilhar clipes de videogame. Centenas de milhões de horas de jogo carregado forneceram o conjunto de dados inicial para treinar modelos de Intuição Geral em raciocínio espaço-temporal – ou entender como se mover no espaço e no tempo.

Mas o ingrediente principal não são as imagens do jogo; são rótulos de ação incorporados no clipe: notas sobre quais botões o player pressionou e quando. A maioria dos concorrentes, disse de Witte, tenta inferir a ação apenas a partir do vídeo, o que ele diz não ser suficiente.

“Vemos isso apenas como a próxima etapa de pré-treinamento no futuro”, disse de Witte. “Temos um modelo único que pode não apenas responder às informações do Fortnite na tela e agir, mas também à dinâmica do mundo real de uma forma que um LLM não consegue.”

A certa altura, de Witte me configurou um laptop rodando o modelo de mundo da General Intuition, um ambiente simulado gerado quadro a quadro em vez de renderizado por um mecanismo de jogo tradicional. Como costumo fazer ao testar modelos mundiais, bati direto em uma série de paredes. Em outras demos que experimentei, o agente que você controla às vezes passa, mas não nesta. Com milhões de horas de jogo, ele aprendeu de alguma forma que paredes são paredes, escadas são dimensionadas e que as sombras aumentam com o movimento do sol.

Para a Intuição Geral, este modelo de mundo não é o seu produto; é um ambiente de treinamento (referido internamente como “ginásio”). Em última análise, as empresas querem vender elas próprias modelos de agentes, e de Witte argumenta que os dados de ação incorporados na jogabilidade ajudam esses modelos a distinguir o “eu” do “ambiente” de uma forma que proporciona uma compreensão mais rica da causalidade.

Embora a tecnologia da General Intuition tenha aparecido na demonstração, a empresa não é a única que tenta resolver este problema. Além disso, não houve nenhuma tentativa de tornar tal modelo viável no mundo físico em larga escala. A maioria das abordagens deste tipo requer grandes quantidades de dados do mundo real que são recolhidos de forma lenta e dispendiosa. A aposta da General Intuition é que a jogabilidade seja um atalho escalável.

Seus investidores também concordaram com a aposta. A última rodada da General Intuition foi liderada pela Khosla Ventures, com a participação da General Catalyst, Jeff Bezos, Eric Schmidt, Nico Rosberg e pesquisadores do Google DeepMind e do MIT.

A maior parte desta rodada será usada para aumentar a capacidade computacional. A General Intuition tem um acordo com a CoreWeave e planeja se concentrar no pré-treinamento da próxima versão do modelo. Uma parte foi alocada para tornar sua API mais amplamente disponível até o final do verão.

Vinod Khosla, cuja empresa liderou a rodada, disse que se sentiu atraído pela visão de De Witte e pela posição de dados proprietários da empresa.

“Se você olhar para o LLM, quando o raciocínio entra em ação, é um salto quântico”, disse-me Khosla em entrevista por telefone. “No modelo mundial, acho que o salto quântico é o surgimento da intuição na IA, uma capacidade que é semelhante à intuição humana. Os dados de ação humana e de reação que você tem nos jogos são uma parte importante do surgimento da intuição.”

A visão é uma empresa geracional

General Intuition depende de dados de clipes de videogame Medal. Crédito da imagem:Medali.TV

A General Intuition não é a única empresa a notar que os dados de ação humana da Medal são uma peça importante do quebra-cabeça na construção de modelos de mundos dinâmicos e agentes gerais. Brianna Martin, chefe de gabinete da startup, disse que a empresa nasceu, em parte, depois que a Medal recusou uma oferta de aquisição de um grande laboratório. Também houve outras ofertas desde então.

De Witte e seus fundadores, Eloi Alonso, Adam Jelley e Vincent Micheli, não estão interessados ​​em serem adquiridos e os investidores da startup ainda não procuram uma saída. A quantidade e a qualidade dos dados proprietários que a General Intuition possui por meio da Medal é um dos motivos pelos quais Khosla acredita que a startup é uma aposta geracional, não uma meta de fusões e aquisições; para que possa se tornar a espinha dorsal dos modelos gerais de agentes e de mundo em simulações e no mundo real.

“Neste momento, tudo o que existe é a aquisição de dados, e isso não é interessante”, disse Khosla.

Parte dessa aposta também envolveu a confiança nos valores de De Witte.

O empresário passou três anos trabalhando na área humanitária, inclusive com Médicos Sem Fronteiras. Portanto, ele traçou uma linha clara sobre como a tecnologia da Intuição Geral seria usada: nenhum agente seria usado para prejudicar os seres humanos.

“Não queremos ser uma parte cada vez maior deste sistema”, disse de Witte. “Digamos que eu saia e diga: ‘Estamos fazendo uma autonomia letal’. O que você acha que acontecerá em outros países?”

Esta limitação ao uso militar surge num momento em que Silicon Valley se torna cada vez mais optimista em relação à guerra, embora De Witte tenha dito que estava satisfeito com o facto de o seu modelo poder ser utilizado em missões de busca e salvamento.

De Witte é holandês e a maior parte da sua equipa é europeia, estabelecendo assim a identidade da empresa. Ele disse que contratou Martin em parte por causa de sua decisão de deixar Palantir publicamente por causa de seu trabalho na Imigração e Alfândega dos Estados Unidos.

“Não sei por que o Vale do Silício faria isso”, disse ele. “Há uma razão pela qual eu não estava lá.”

A ética de De Witte não limita simplesmente o que os modelos não farão. Como um jogador que ganhou US$ 1,5 milhão construindo e hospedando um servidor RuneScape privado na adolescência, de Witte também pensa no que acontece com as pessoas que ficam para trás nas capacidades dos modelos de IA.

A General Intuition lançou recentemente uma plataforma chamada Nerve, um mercado de trabalho que permite aos jogadores ganhar dinheiro usando configurações existentes. Aqueles que se inscrevem começam com a rotulagem de dados e podem eventualmente passar para a teleoperação do robô e outras tarefas. A base de usuários da Medal, disse de Witte, é a geração mais vulnerável ao deslocamento impulsionado pela IA, e ele deseja que eles participem do que vem a seguir.

Volante de dados

De Witte deseja que a General Intuition se torne um facilitador de ecossistema, como a Anthropic ou a OpenAI – um fornecedor de modelos que permita que outros aproveitem a sua tecnologia. Atualmente, a startup conta com diversos clientes nas áreas de games, simulação e robótica.

“Não vamos construir uma empresa de automóveis sem motorista”, disse de Witte. “Vamos tornar 10 vezes mais fácil para a próxima pessoa construir uma empresa de automóveis autônomos.”

A empresa diz que assim que sua API alcançar mais clientes, ela será capaz de testar suas capacidades com uma variedade de casos de uso – como testar robôs em gêmeos digitais em fábricas, executar bots semelhantes a humanos em estúdios de jogos ou enviar animais de quatro patas para navegar em ambientes perigosos.

Embora os quadrúpedes sejam a primeira personificação física que a General Intuition experimentou no mundo real, ela também experimentou drones e outros dispositivos, incluindo modelos de teste em jogos de direção.

“Funciona em qualquer coisa que você possa controlar usando um controlador de jogo ou teclado e mouse”, disse de Witte.

A possibilidade de construir um volante de dados é um dos objetivos.

“Escolheremos clientes onde possamos diversificar a concretização que é a espinha dorsal deste modelo de base comum”, disse de Witte. “Portanto, priorizaremos a seleção dos clientes para saber se eles podem oferecer dados do mundo real que sejam interessantes e úteis para impulsionar a pesquisa. E se eles têm uma equipe interna ágil onde podemos ser verdadeiros parceiros e aprender uns com os outros.”

Khosla disse que os dados proprietários da General Intuition foram o que os trouxe até aqui, e sua capacidade de continuar coletando dados que ninguém mais possui será crítica. Especialmente porque, apesar das demonstrações impressionantes, se a transferência de simulações para o mundo real pode ser feita em grande escala é uma questão em aberto que ninguém respondeu totalmente.

Correção: Uma versão anterior deste artigo indicava incorretamente o número de anos que Pim de Witte passou em trabalho humanitário.

Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isto não afeta a nossa independência editorial.



Link da fonte