Framework CAMEL-AI para simulação social em escala com até 1 milhão de agentes
OASIS (Open Agent Social Interaction Simulations) é um framework open-source para simulação de dinâmicas sociais usando agentes LLM. Desenvolvido como parte do ecossistema CAMEL-AI e documentado no paper arXiv:2411.11581, o OASIS cria ambientes de mídia social completos onde agentes autônomos publicam, comentam, seguem e interagem. Diferente de simulações baseadas em agentes tradicionais (ABM) que usam regras fixas, o OASIS delega decisões ao LLM, permitindo comportamentos emergentes mais ricos e imprevisíveis. A arquitetura separa o Environment Server (que mantém o estado do mundo) dos Agent Workers (que processam decisões individuais), permitindo escalonamento horizontal.
O OASIS é a fundação sobre a qual o MiroFish constrói suas simulações sociais. Compreender sua arquitetura é essencial para customizar simulações, diagnosticar comportamentos inesperados e interpretar resultados corretamente. Ele representa o estado da arte em simulação social com LLMs.
O OASIS alcança a escala de 1 milhão de agentes através de três inovações arquiteturais: (1) Paralelização massiva de chamadas LLM usando async workers com rate limiting inteligente que respeita limites de API sem desperdiçar throughput. (2) Batching de decisões onde múltiplos agentes similares têm suas decisões processadas em uma única chamada LLM com few-shot examples. (3) Group subscriptions que reduzem a complexidade de comunicação de O(n²) para O(n·k), onde k é o número de grupos, usando broadcast dentro de clusters de agentes com interesses similares em vez de comunicação ponto-a-ponto.
Fenômenos emergentes dependem de escala. Polarização, cascatas de informação e formação de bolhas só se manifestam de forma realista com populações grandes. Entender como o OASIS escala permite projetar simulações que capturam esses fenômenos macro sem explodir custos de API.
O OASIS define um espaço de ações discretas que modela o comportamento em redes sociais reais. As 23 ações cobrem quatro categorias: Conteúdo (create_post, reply, repost, quote_post, edit_post, delete_post), Social (follow, unfollow, mute, unmute, block, unblock), Engajamento (like, unlike, bookmark, unbookmark, search, view_trend, view_profile), e Passivas (scroll_feed, refresh, do_nothing, log_off). Cada agente escolhe uma ação por round com base em seu feed atual, persona e memória. O LLM recebe a lista de ações válidas e retorna sua escolha com parâmetros.
O espaço de ações é a interface entre cognição e comportamento. Cada ação tem consequências diferentes na propagação de informação: um repost amplifica exponencialmente, um mute cria bolha de filtro, um do_nothing modela inatividade real. Configurar quais ações estão disponíveis muda drasticamente a dinâmica da simulação.
O OASIS implementa dois ambientes de plataforma social: TwitterEnv (baseado em timeline cronológica com modelo follow/follower, retweets e trending topics) e RedditEnv (baseado em subreddits com upvote/downvote, threading aninhado e múltiplos rankings: hot, new, top, controversial). Os agentes podem participar de ambas plataformas simultaneamente, com comportamento adaptado ao contexto de cada uma - por exemplo, posts mais longos e argumentativos no Reddit, mais curtos e virais no Twitter.
Fenômenos de migração cross-platform são cruciais em desinformação e formação de opinião. Conteúdo nasce em uma plataforma e viraliza em outra. A simulação dual-platform captura essa dinâmica que simulações single-platform ignoram completamente.
Cada plataforma simulada implementa seu próprio sistema de recomendação que determina o feed de cada agente. O TwitterEnv combina timeline cronológica dos seguidores com um ranking baseado em cosine similarity entre os interesses declarados do agente e o conteúdo dos posts. O RedditEnv implementa o hot score do Reddit real: score = log10(max(|ups - downs|, 1)) + sign(ups - downs) × epoch_seconds / 45000. Ambos incluem um feed_size_limit que controla quantos posts o agente "vê" por round, simulando atenção limitada.
O sistema de recomendação é o fator mais determinante na formação de bolhas de informação. Alterar a fórmula de ranking (ex: aumentar peso de recência vs engagement) muda completamente quais fenômenos emergem. É a variável experimental mais poderosa do OASIS.
O paper arXiv:2411.11581 apresenta validação experimental rigorosa mostrando que o OASIS reproduz três fenômenos sociológicos fundamentais: (1) Cascatas de informação que seguem distribuição power-law, compatível com dados reais do Twitter - poucos posts viralizam, a maioria morre rapidamente. (2) Polarização de grupo onde opiniões intra-grupo convergem e inter-grupo divergem, medida via distância de opinião em escala Likert. (3) Efeito manada (herd behavior) onde agentes LLM demonstram conformidade social mais intensa que humanos reais - um achado crucial que sugere que LLMs treinados com RLHF têm viés inerente de conformidade.
A validação empírica é o que diferencia simulação de especulação. Saber que cascatas power-law são reproduzidas com fidelidade dá confiança nesse aspecto. Saber que herd behavior é amplificado alerta para cautela na interpretação de consensos simulados. Esta calibração é essencial para uso responsável.