Kalshi: dados alternativos em economia e finanças


Olá, Reader, como foi o final de semana?

A edição 182 do Boletim AM está no ar!

Quando eu comecei nesse negócio lá em 2015, a profissão de Cientista de Dados ainda não era muito conhecida no Brasil.

Na verdade, o termo ciência de dados nem era muito usado.

Era tudo mato alto.

No mundo particular dos economistas e da análise de dados econômicos e financeiros, então, a coisa era feia.

Séries temporais regulares, com mais de 100 observações, era luxo.

Afinal, o país que começou a vencer a hiperinflação em 1994 só conseguiu ter séries econômicas e financeiras razoáveis a partir dos anos 2000.

Então, se você soubesse organizar seus dados no Excel, conseguisse rodar algumas dúzias de modelos em Eviews ou Stata e chegasse a alguma conclusão (quantitativa e não opinativa) minimamente decente a partir disso, já estava muito à frente do mercado.

Lembre-se que naqueles tempos, ainda havia um debate (meio tosco) na academia brasileira entre heterodoxos vs ortodoxos.

No Instituto de Economia - da Praia Vermelha, com passagem por Barão Geraldo - tinha um professor que, inclusive, duvidava do uso de dados em economia. Dizia, com uma boa dose de arrogância, que economia é um sistema dinâmico tão complicado que não pode ser compreendido usando estatística.

Dados e evidências eram coisas de engenheiro, não de economistas.

Pois é, Reader, tempos loucos.

10 anos depois, felizmente, os dados venceram.

E hoje em dia, estão até ensinando análise de dados nas faculdades, veja você - inclusive nessas casas mais avessas à evidência empírica.

Há, diga-se de passagem, uma corrida contra o tempo nas faculdades de economia para incorporar disciplinas como análise de dados, linguagens de programação, estatística e econometria aplicadas...

Tem um pessoal implementando até cursos de IA nas grades curriculares.

É tipo 7x1.

E dá até um certo orgulho de canto de boca quando olho para trás e vejo aqueles debates intermináveis com o pessoal heterodoxo.

Mas, Vítor, você pergunta, por que diabos está me contando tudo isso?

Estou te contando esse trem todo, como dizem meus amigos mineiros, para te falar sobre a próxima onda que vem por aí...

E não, não é IA.

A pandemia gerou uma ruptura muito forte na humanidade e antecipou diversas tendências.

Uma delas é que estamos utilizando cada vez mais dados alternativos.

Isto é, dados provenientes de satélites, de logística e comércio, transações e pagamentos, mobilidade e geolocalização, dados climáticos e ambientais, dados de sentimento e texto, dados imobiliários e urbanos, dados de web e digitalização...

Dados estruturados advindos de bancos de dados relacionais, onde linhas são observações e colunas são features, agora se juntam a dados semiestruturados (arquivos de logs, JSON, XML, etc) e dados não estruturados (emails, documentos, pdfs...) para gerar um ambiente extremamente rico e inovador.

Quer um exemplo?

Enquanto você estava pulando carnaval, o Federal Reserve - o BC norte-americano - publicou um paper sobre o uso de uma nova fonte de dados para averiguar expectativas de agentes: a plataforma Kalshi.

Kalshi é a primeira plataforma regulamentada pelo governo norte-americano onde os investidores apostam diretamente em resultados econômicos, como inflação, folha de pagamento e decisões do próprio FED.

Os resultados encontrados pelo paper sugerem que esses (novos) mercados (de alta frequência) produzem previsões de densidade bem calibradas e de atualizaçao rápida sobre importantes variáveis econômicas.

Inclusive, diga-se, sobre várias para as quais não existem medições confiáveis hoje em dia.

Trocando em miúdos...

Em outras palavras, Reader, existe um oceano azul de informações que ainda serão incorporadas para gerar previsões cada vez mais acuradas de dados econômicos e financeiros.

Mas para isso...

Você vai precisar sair da sua bolha de dados tabulares e séries temporais.

Esse trem partiu.

Rodar algumas dezenas de modelos já não diz muita coisa.

Nem mesmo 10.000 modelos.

Incorporar dados não convencionais ou alternativos na análise económica passa a ser o grande alvo de analistas e pesquisadores.

Porque, pensa comigo, o que é a essência de um dado econômico?

Um dado econômico é basicamente um sinal de mudança dentro do organismo de trocas.

Basicamente, quando construímos um dado econômico estamos medindo essas mudanças em preços e quantidades de trocas feitas dentro da sociedade.

Incorporar, portanto, novas formas de mensurar isso é mais do que bem-vindo.

É sentir o pulso da economia com maior riqueza de detalhes.

Construir esse arcabouço, porém, vai exigir do analista cada vez mais conhecimentos em lidar com dados não estruturados, com o uso de ferramentas de processamento de linguagem natural e análise de imagens, por exemplo.

Além disso, a ciência de dados escalou nos últimos anos, de modo que se antes a gente rodava alguns modelos nos nossos notebooks, hoje o que se faz é rodar milhares de modelos com milhares de features estruturadas e não estruturadas em produção, dentro de alguma nuvem.

A área de finanças e economia, naturalmente, vai passar por esse mesmo processo.

Então, se hoje, as instituições campeãs do Focus ainda estão na primeira fase do uso de ciência de dados, daqui a alguns anos, à medida que incorporem mais e mais engenharia de dados, vamos para a segunda fase.

Nesse momento, veremos previsão de inflação, por exemplo, em tempo real.

Não é algo distante.

Vejo muitas casas (grandes) se movendo para isso.

Vejo cada vez mais a adoção de soluções em modernas plataformas de Lakehouse, como Databricks, que possibilitam organizar pipelines de dados estruturados e não estruturados.

Soluções que envolvam deep learning serão cada vez mais incorporadas no dia a dia da profissão, à medida (claro) que esses tais dados estejam disponíveis.

E a evolução está acontecendo bem rápido.

Como você está se preparando por aí?

Era uma das perguntas que eu gostaria de fazer, viu, para aquele professor da Praia Vermelha...


Um abraço,
Vítor Wilher — Análise Macro
A verdade está nos dados

Perdeu alguma edição anterior do Boletim AM? Sem problemas. Leia as edições anteriores tocando aqui

Boletim AM

Receba todo domingo à noite em seu e-mail nossa newsletter com exercícios reais de análise de dados econômicos e financeiros, envolvendo muito estatística, econometria, machine learning e inteligência artificial em R e Python. Tudo o que você precisa saber para estar antenado no mundo dos dados!

Read more from Boletim AM

Olá, Reader, como foi o final de semana? A edição 181 do Boletim AM está no ar! Após algumas semanas de férias, voltei a atender alunos aqui na Análise Macro. São momentos importantes para mim porque entendo exatamente como posso melhorar nossos produtos. Ou, produzir novas soluções para os problemas e demandas que vocês têm. E aqui, os alunos se dividem basicamente em dois grupos: iniciantes e avançados. O primeiro grupo, em geral, é formado por estudantes ou profissionais de mercado que por...

Incerteza

A edição 180 do Boletim AM está no ar! Olá, Reader, como foi a semana por aí? Por aqui, as coisas foram bem agitadas. Recebi a notícia de que fui aceito no Doutorado em Economia da Fundação Getúlio Vargas. Você não sabe o quanto eu fiquei feliz com isso. Há mais de 10 anos, lá estava eu, um menino com 32 anos, defendendo a dissertação de mestrado Clareza da Comunicação e Expectativas de Inflação: evidências para o Brasil. Na Banca, meus professores da Universidade Federal Fluminense da área...

A edição 179 do Boletim AM está no ar! Olá, Reader, como foi a semana por aí? Por aqui, sigo lendo o Empire of AI: Dreams and Nightmares in Sam Altman's OpenAI, da jornalista Karen Hao. Sam Altman superou a tentativa de "golpe" do início do livro e segue sendo o CEO da OpenAI, na sua saga para construir um IA Geral que beneficie a humanidade. Hao nesse momento está dando um "passo atrás" para contar como a OpenAI foi criada, as conversas entre Musk e Altman e a estória do protagonista do...