RREORGFdataR é um pacote R focado em alta performance para a extração, consolidação e automação de dados orçamentários e fiscais provenientes da API do SICONFI (https://apidatalake.tesouro.gov.br/docs/siconfi/). O pacote foi projetado para analistas e pesquisadores que necessitam integrar grandes volumes de dados (RREO e RGF) em fluxos de trabalho de Ciência de Dados de forma eficiente.
Saiba mais sobre a utilização do ‘RREORGFdataR’ em https://natanaelsl.com.br/project/rreorgf_pkg/ ou https://natanaelsl.github.io/RREORGFdataR/.
Visão geral
RREOdata(): Realiza a extração automatizada e em lote dos dados do Relatório Resumido da Execução Orçamentária (RREO). A função utiliza uma arquitetura de malha paramétrica (produto cartesiano) para resolver múltiplas consultas em uma única chamada, otimizando o consumo de RAM através de pré-alocação de memória e processamento determinístico.RGFdata(): Extrai de forma intuitiva os dados do Relatório de Gestão Fiscal (RGF). Compartilha a mesma engine de alta performance doRREOdata, permitindo a consulta multivariada de anos, entes federativos, poderes e períodos de referência com consistência total no formato dos dados.siconfi_list(): Ferramenta de gestão de metadados. A opçãoaction = "view"(padrão) carrega o dicionário de códigos do IBGE e SICONFI diretamente da estrutura interna do pacote. A opçãoaction = "download"provê integração direta com o repositório do Tesouro Nacional, baixando o catálogo oficial em PDF com gerenciamento inteligente de caminhos de diretório (cross-platform).
Principais Funcionalidades
Extração Vetorizada: Suporte a grades paramétricas complexas (produto cartesiano de entes, anos e períodos) em uma única chamada.
Gestão de Memória: Arquitetura otimizada que utiliza pré-alocação e processamento eficiente para evitar estouros de RAM.
Persistência Direta: Suporte nativo para exportação em formatos de alta performance como Parquet (via arrow), RDS e CSV.
UX Inteligente: Interface CLI amigável com barra de progresso (ETA), tratamento de erros fail-fast e macros para extração em lote (ex: all_states, all_muni).
Instalação
Você pode instalar a versão de desenvolvimento do RREORGFdataR no GitHub com:
# install.packages("devtools")
devtools::install_github("Natanaelsl/RREORGFdataR", build_vignettes = TRUE)Exemplo de Uso
Abaixo, um exemplo de como extrair dados em lote e salvar diretamente para um pipeline de Data Lake:
library(RREORGFdataR)
# 1. Extração eficiente de dados do RGF (Estados, 2020-2023, 3º quadrimestre)
dados_rgf <- RGFdata(
cod.ibge = 52,
year = 2020:2023,
power = c('E', 'L', 'J', 'D', 'M'),
period = 3,
annex = 1
)
# 2. Pipeline de Data Lake: Extração massiva e persistência em Parquet
RREOdata(
cod.ibge = "all_states",
year = 2024,
period = 1:6,
annex = 1,
save_path = "data/rreo_estados_2024.parquet"
)Informações
Sobre a API SICONFI
O SICONFI é a fonte oficial dos dados contábeis e fiscais do setor público brasileiro. Este pacote abstrai a complexidade da API REST, tratando automaticamente a tradução de colunas temporais (formatos <MR-X>) para objetos de data nativos do R, facilitando análises imediatas.
Código das instituições
A tabela abaixo apresenta os códigos do IBGE e do Siconfi compatíveis com a API, bem como a respectiva instituição. Disponível em: https://siconfi.tesouro.gov.br/siconfi/pages/public/arquivo/conteudo/Cod_instituicoes_siconfi.pdf


