WIP scrapeo de precios en supermercados
Go to file
Cat /dev/Nulo 38b6b62aba cositas en la BD 2024-04-12 20:32:35 -03:00
.devcontainer devbox 2024-02-23 10:26:30 -03:00
.github/workflows a verrr 2024-03-11 10:57:34 -03:00
.vscode renombrar warcificator -> scraper-rs 2024-01-10 21:46:10 -03:00
data lista jumbo actualizada 2024-01-11 15:30:25 -03:00
db-datos cositas en la BD 2024-04-12 20:32:35 -03:00
scraper-rs añadir optimizaciones sqlite 2024-04-04 10:50:34 -03:00
sitio upgrade a drizzle-orm 0.30 2024-04-12 20:23:51 -03:00
.dockerignore ignorar db en dockerignore 2024-01-24 18:49:26 -03:00
.gitattributes carrefour.txt 2023-12-21 14:00:46 -03:00
.gitignore ignorar todo lo que tiene .db 2024-02-06 19:28:56 -03:00
Dockerfile WIP 2024-02-06 19:28:56 -03:00
devbox.json devbox: sacar cargo de dependencias 2024-04-04 23:00:09 -03:00
devbox.lock devbox: sacar cargo de dependencias 2024-04-04 23:00:09 -03:00
pnpm-lock.yaml upgrade a drizzle-orm 0.30 2024-04-12 20:23:51 -03:00
pnpm-workspace.yaml borrar scraper js 2024-01-15 15:47:34 -03:00
readme.md mira precios 2024-04-08 17:07:47 -03:00
tsconfig.json tsconfig: arreglar diagnostics 2024-01-24 18:49:17 -03:00

readme.md

preciazo

scrapeo "masivo" de precios y datos en supermercados argentinos

¡entrá a la demo!

¿te interesa colaborar con el proyecto? hablame por Twitter, por email o por GitHub :)

proyectos similares

componentes

scraper-rs

el scraper busca links de productos a scrapear, descarga todos los links, extrae varios datos y los guarda en una base de datos SQLite (definida en db-datos).

(antes había un scraper escrito en JavaScript, pero por problemas de reliability lo reescribí en Rust (?))

sitio

el sitio renderiza páginas a partir de la base de datos y hace gráficos lindos.

setup

para el schema de la base de datos y el sitio, es necesario Node.js y pnpm. para el scraper, es necesario Rust estable.

crea la base de datos:

cd db-datos/
pnpm install
pnpm migrate

después, escrapea un sample de productos de Carrefour a una BD:

cd ../scraper-rs/
cargo run -- fetch-list ../data/samples/Carrefour.50.txt

ahora miralo en el sitio:

cd ../sitio/
pnpm install
pnpm dev