This repository has been archived on 2024-02-11. You can view files and clone it, but cannot push or open issues or pull requests.
sitio/Subdivx.md

29 lines
1.6 KiB
Markdown
Raw Normal View History

2021-12-01 01:24:21 +00:00
[Subdivx](https://subdivx.com) está desapareciendo. Acá documento nuestros esfuerzos archivándolo.
2021-11-30 22:13:33 +00:00
2021-11-30 22:25:44 +00:00
Fechas en GMT-3.
2021-11-30 23:04:32 +00:00
## Si querés contribuir
Estoy descargando los archivos iniciales para saber los enlaces de los subtítulos. Mientras tanto, andá preparando una maquina con buena conexión a internet y espacio en disco, idealmente con Linux.
2021-11-30 22:13:33 +00:00
## 2021-11-30
2021-12-01 01:22:29 +00:00
- Descargué todas las paginas de los subtítulos, es decir, `https://www.subdivx.com/?pg={1..5490}`. Esto sirve como indice a todas las paginas de los subtítulos y autorxs.
2021-12-01 22:32:45 +00:00
- 19:12 - Estoy descargando todas las paginas de los subtítulos (`https://www.subdivx.com/X6*.html`). ~~Son `548.825` en total.~~ Corregido, leer abajo.
2021-11-30 22:25:44 +00:00
- 19:25 - Registré `#updivx` en el IRC pirata para el proyecto.
2021-12-01 00:30:46 +00:00
- 21:30 - Cambia el anuncio en Subdivx para decir:
> Bueno, me convencieron, seguimos... cualquier cosa me escriben en @deifar
Seguimos archivando por las dudas.
2021-12-01 01:22:34 +00:00
- 22:10 - Empezamos a distribuir tareas para descargar las paginas de los subtítulos.
2021-12-01 17:17:48 +00:00
## 2021-12-01
- 13:35 - Descubrí que usar wget con muchas listas separadas es _mucho_ más eficiente que aria2. Descargando cosas a ~mil por segundo.
2021-12-01 22:32:45 +00:00
- 19:31 - Terminé de bajar todo y descomprimirlo, ahora a extraer enlaces de subtitulos para descargar. Antes dije que eran `548.825` subtitulos, pero en realidad son `548.815`; habían 10 duplicados por alguna razón.
2021-12-02 18:19:35 +00:00
## 2021-12-02
- 15:18 - Subdivx falla al cargar algunas paginas aleatoriamente con "Unable to Connect db". Estoy revisando si reporta el error correctamente con un código de estado HTTP.