La elaboración de políticas basadas en datos representa los esfuerzos por aumentar la eficiencia y el impacto de las políticas, fundamentándolas en hechos y datos. Su objetivo es reducir al mínimo los fallos de las políticas causados por un desajuste entre las expectativas de los gobiernos y las condiciones reales sobre el terreno. En ese sentido, este proceso puede aplicarse tanto a las administraciones pequeñas como a las grandes.
La elaboración de políticas basadas en los datos por parte de los gobiernos locales es una tendencia que crece rápidamente impulsada por tres fuerzas coincidentes:
- Crecimiento exponencial de los datos: el 90% de los datos del mundo se crearon en los últimos dos años, y cada día se crean 2.500 millones de gigabytes de datos. Las ciudades no son una excepción a esa regla exponencial. Recogen datos de contaminación del aire a través de sensores, datos de aparcamiento a través de medidores inteligentes, datos de rendimiento a través de los diferentes departamentos… Y cuando se trata de la participación en línea, también recogen las contribuciones compartidas por los residentes en las plataformas en línea.
- Tecnologías emergentes: Los datos por sí solos no valen nada. El 80% de todos los datos son datos no estructurados, sin formato – la mayoría de ellos son textos escritos, imágenes, audio o video. Se necesitan tecnologías para obtener, limpiar, procesar y analizar estos datos con el fin de extraer conocimientos relevantes. La IA (particularmente la PLN, un subconjunto de la IA) y las técnicas de aprendizaje automático han demostrado ser herramientas inestimables cuando se trata de dar sentido a enormes cantidades de datos no estructurados y convertirlos en resultados explotables.
- Experiencia ciudadana: Los líderes gubernamentales se centran cada vez más en la experiencia ciudadana como una función básica del gobierno. La utilización de los datos de los ciudadanos para fundamentar las decisiones es fundamental para que los grandes sistemas públicos puedan prestar servicios que satisfagan las necesidades de las personas.
Por lo tanto, no es sorprendente que la Asociación Europea de Innovación para Ciudades y Comunidades Inteligentes (EIP-SCC) prevea que el mercado mundial de las ciudades inteligentes tendrá un valor de 1,2 billones de dólares a principios de la década de 2020.
Como con cada nueva tendencia, la toma de decisiones basada en los datos también tiene sus propias dificultades. Aquí hay 3 mejores prácticas para evitarlos.
1. Transparencia 2.0
Cada vez más gobiernos están abriendo (parte de) los conjuntos de datos que utilizan internamente. Algunos incluso abren el código fuente de las herramientas y algoritmos que aplican en estos conjuntos de datos – Amsterdam (NL) es sólo un ejemplo. Y en Francia, la Ley de la República Digital (o ley de “datos abiertos por defecto“), exige a todos los organismos gubernamentales del país que liberen todos los conjuntos de data al dominio público, a menos que contengan información sensible.
“Transparencia 2.0” va un paso más allá. Donde los datos abiertos y la fuente abierta pueden ser suficientes para que los científicos e ingenieros de datos entiendan realmente lo que está sucediendo, definitivamente no es suficiente para la mayoría de los ciudadanos encontrar información clara. La transparencia 2.0 requiere un paso de traducción activa para hacer que los datos sean realmente accesibles e informativos. Los algoritmos y el código se traducen en texto accesible y visuales que explican en términos simples lo que está pasando bajo el capó. Los ciudadanos pueden, por ejemplo, entender cómo se procesan los datos, en qué supuestos subyacentes se basa el código, o qué información se introdujo en los resultados y conclusiones.
La transparencia conduce a una relación de confianza con sus ciudadanos, y también podría permitir que surgieran iniciativas de colaboración de las sociedades civiles. Este tipo de iniciativa puede ser una importante fuerza motriz cuando los gobiernos tratan de abordar desafíos complejos que abarcan múltiples ámbitos.
Buena entrada de data, buena salida de data…
La calidad de sus datos de entrada afecta mucho a la salida de la automatización. La mayor parte de la calidad de la entrada se define por la forma en que se empiezan a recoger los datos. Asegúrate de que los datos recogidos se estructuren de manera que reflejen lo que quieres hacer con esos datos o lo que quieres aprender de ellos. ¿Recoger datos para combinarlos con un conjunto de datos existente? Asegúrese de que haya un vínculo estructural entre ambos, por ejemplo, la fecha y la hora de la medición. ¿Necesitas un análisis espacial de tus datos? Asegúrate de que también recoges la ubicación de tus datos, en un formato que sea fácilmente legible por tu sistema de información geográfica (GIS).
Esta regla es aún más cierta cuando se trabaja con datos no estructurados, como texto, imágenes, vídeo o audio. La mayoría de los datos recogidos a través de la participación ciudadana son datos no estructurados. Se puede mejorar el análisis estableciendo el proceso de participación de tal manera que de hecho se recogen datos semi-estructurados. Algunos ejemplos:
- Abrir la participación y permitir que las personas interactúen con las aportaciones de otros participantes (esto significa permitir que los participantes voten sobre una idea existente, en lugar de introducir una idea similar). De esa manera, se evitará tener muchas aportaciones duplicadas para procesar. Y las propias interacciones resultan ser una nueva y valiosa fuente de conocimientos (por ejemplo, los comentarios aportan matices y perspectivas diferentes a una idea concreta).
- Haz preguntas específicas. Por ejemplo, la pregunta “¿Qué te pareció la conferencia y la comida?” debería dividirse en dos preguntas separadas. Al hacerlo, te aseguras de que estás recogiendo información relevante y fiable para cada pregunta.
- Pide a los participantes que localicen sus aportaciones o que añadan temas o etiquetas, si quieres usarlas como una forma de analizar sus aportaciones más adelante. Recomendamos que usted mismo defina un conjunto de etiquetas: es más fácil trabajar con un grupo de comentarios todos etiquetados como “movilidad” que trabajar con comentarios etiquetados como “coche“, “bicicleta“, “tráfico” y “luz roja“.
- ¿Realmente una pregunta abierta es la respuesta? Por las razones que resaltamos arriba, puede ser un reto y llevar mucho tiempo procesar los resultados de una pregunta abierta de que no estás trabajando con un poderoso software de PLN. Siempre que pueda, reemplace las preguntas abiertas de opción múltiple con una opción de “otro”.
No te olvides de los humanos
Mientras que los datos pueden ser los reyes en estos días, es bueno tener algunos controles y equilibrios en su lugar. En otras palabras, las máquinas no son suficientes: todavía necesitamos a los humanos.
Una conclusión basada en datos puede ser muy convincente, más aún cuando se presenta visualmente. Cuando algo se expresa en forma de números o gráficos, da fácilmente la impresión de que no necesita más explicación. Sin embargo, el conjunto de datos podría estar incompleto, los algoritmos basados en supuestos falsos o la conversión de los datos podría haberse realizado utilizando el sistema métrico equivocado. Por consiguiente, la interpretación, la pericia y el pensamiento crítico del ser humano siguen siendo indispensables.
Lleva la conclusión basada en los datos a tus interesados, muéstrales cómo se llegó a la conclusión y pídeles su opinión. Cuando se aplica a la participación ciudadana, esto significa vincular la aportación original de los ciudadanos con la conclusión, destacando los pasos intermedios. De esa manera, los participantes pueden indicar su acuerdo o desacuerdo con el proceso y los supuestos, y se pueden hacer correcciones.
En pocas palabras, se trata de entender los puntos fuertes y débiles tanto de la tecnología de datos por un lado, como de la experiencia humana por el otro. La tecnología de datos es excelente para encontrar patrones y conexiones lógicas, reduciendo así los sesgos humanos como el “sesgo de reciente”. Los humanos son maestros en traer matices y contextos a la mesa. Donde los humanos solían tener el monopolio de responder a la pregunta del “Por qué”, la tecnología de los datos ahora también se está moviendo rápidamente más allá de sus antiguos límites de las preguntas del “Qué” y el “Cómo”.
When analyzing unstructured data such as written citizen input, one also has to recognize that the applied technologies such as NLP are not (yet) 100% accurate. Text can be misinterpreted, misclassified, or wrongly translated. If the decision at stake requires 100% accuracy, it is recommended to check the data-based conclusion and correct where necessary.
Olvídate de los grandes números y las aplicaciones de lujo – en el gobierno local, la formulación de políticas basadas en datos comienza con pequeños y fiables conjuntos de datos y procesos humanos. Puede tener un impacto enormemente positivo en ciudades de todos los tamaños. En el CitizenLab, nuestro equipo de “Perspectivas” trabaja en estrecha colaboración con varios gobiernos para hacer que la formulación de políticas basadas en datos sea una realidad para todos los gobiernos. Si deseas saber más acerca de cómo ayudamos a los gobiernos a obtener ideas útiles para mejorar la toma de decisiones, no dudes en ponerte en contacto con nosotros.