Corrección de Caracteres UTF-8 Mal Codificados
Corrección de Caracteres UTF-8 Mal Codificados
Problema
Algunos posts contienen caracteres UTF-8 mal codificados que aparecen como secuencias extrañas:
â€"→ debería ser-(guión)“→ debería ser"(comillas izquierda)â€→ debería ser"(comillas derecha)•→ debería ser•(bullet point)…→ debería ser...(puntos suspensivos)Antigüedad→ debería serAntigüedad
Archivos Corregidos
Ya se han corregido los siguientes archivos:
- ✅ 2024-05-08-poc-etl-low-cost-fabric-costes.md (título con guión)
- ✅ 2018-10-23-conectarse-origenes-datos-power-bi-desktop-excel-2016.md
- ✅ 2018-11-06-transformar-datos-power-query.md
- ✅ 2018-11-19-combinar-consultas-coincidencias-aproximadas.md
- ✅ 2020-07-27-dax-treatas.md
Archivos Pendientes
Quedan aproximadamente 16 archivos con caracteres problemáticos. La mayoría son casos menores (comillas, puntos suspensivos) que no afectan la legibilidad principal del contenido.
Cómo Corregir Nuevos Casos
Opción 1: Manualmente con Replace String
Para cada archivo:
- Identificar el texto con caracteres problemáticos
- Usar el editor para reemplazarlo con el carácter correcto
Opción 2: Script Automático (en desarrollo)
El script corregir-encoding.ps1 está disponible pero necesita ajustes para funcionar correctamente con todos los casos.
Prevención
Para evitar estos problemas en el futuro:
- Asegurar UTF-8 sin BOM: Todos los archivos .md deben guardarse en UTF-8 sin BOM
- Usar editor con encoding correcto: VS Code, por ejemplo, con:
"files.encoding": "utf8", "files.autoGuessEncoding": false - Verificar antes de commit: Buscar estos patrones antes de hacer push:
Get-Content archivo.md | Select-String "â€"
Comando para Encontrar Archivos Afectados
cd _posts
Get-ChildItem -Filter "*.md" | Select-String -Pattern "â€" -SimpleMatch | Group-Object Filename | Select-Object Name, Count | Sort-Object Count -Descending
Estado Actual
- Corregidos: 5 archivos principales
- Pendientes: ~16 archivos con casos menores
- Prioridad: Alta para títulos y guiones, baja para comillas y puntos suspensivos internos
Los casos más importantes (títulos de posts y guiones en nombres) ya están corregidos. Los casos restantes son principalmente comillas decorativas y puntos suspensivos que no afectan la comprensión del contenido.