preciazo/readme.md

42 lines
1,023 B
Markdown
Raw Normal View History

2023-12-27 22:55:08 +00:00
# preciazo
scrapeo "masivo" de precios y datos en supermercados argentinos
## componentes
2023-12-27 22:55:08 +00:00
### scraper-rs
2023-12-27 22:55:08 +00:00
el [scraper](./scraper-rs/) busca links de productos a scrapear, descarga todos los links, extrae varios datos y los guarda en una base de datos SQLite (definida en [db-datos](./db-datos/schema.ts)).
2023-12-27 22:55:08 +00:00
(antes había un scraper escrito en JavaScript, pero por problemas de _reliability_ lo reescribí en Rust (?))
### sitio
el [sitio](./sitio/) renderiza páginas a partir de la base de datos y hace gráficos lindos.
2023-12-27 22:55:08 +00:00
## setup
para el schema de la base de datos y el sitio, es necesario [Node.js](https://nodejs.org/) y [pnpm](https://pnpm.io/). para el scraper, es necesario [Rust](https://www.rust-lang.org/) estable.
crea la base de datos:
```
cd db-datos/
pnpm install
pnpm migrate
```
2023-12-27 22:55:08 +00:00
2024-01-02 03:21:21 +00:00
después, escrapea un sample de productos de Carrefour a una BD:
2023-12-27 22:55:08 +00:00
```
cd ../scraper-rs/
cargo run -- fetch-list ../data/samples/Carrefour.50.txt
2023-12-27 22:55:08 +00:00
```
ahora miralo en el sitio:
```
cd ../sitio/
pnpm install
pnpm dev
2023-12-27 22:55:08 +00:00
```