Problemas complejos

Para cada problema complejo hay una respuesta que es clara, sencilla, y equivocada.

H. L. Mencken, citado en Pawn Sacrifice (película biográfica sobre Bobby Fischer), dirigida por Edward Zwick en 2014.

No, la UE no va tan rezagada en el 5G como te lo pintan

En la prensa española se ha convertido en meme (en el sentido original del término) decir que la UE va rezagadísima en todo lo que respecta al 5G, la nueva generación de tecnologías de comunicación inalámbrica frente a Estados Unidos y China (1, 2, 3).

Huelga decir que esta visión extremadamente pesimista no es compartida en todo el continente. Dejando de lado que en Alemania la mayoría de notician versan sobre las subastas de frecuencias para 5G, de las que en España no hemos oído hablar todavía (recordemos que el liderazgo en ciertos ámbitos es cuestión de esfuerzo, tesón, y actitud), aún hay sitio para análisis de mercado que diferen en sus conclusiones de lo que solemos leer en la prensa de estas latitudes.

Voy a intentar comentar esto con tres ideas sencillas.

Idea 1. No, no todos los países de la UE están igual de avanzados/retrasados en este tema. No, la gobernanza de la UE en sus sillones de Bruselas tiene un peso limitadísimo en este tema, cuando el desarrollo del nuevo estándar está siendo un proceso complejo en el que, a falta de mayor acuerdo, todos los implicados han optado por realizar su propia implementación con la esperanza de que su versión del estándar sea adoptada por la competencia, y alcanzando acuerdos pragmáticos con otros actores implicados para facilitar esta adopción (algo de lo que hablamos en un post sobre el tema hace ya casi un año).

Idea 2. No se trata de negar que las empresas chinas, no solo Huawei sino también ZTE, tengan tecnología punta y estén avanzando a gran ritmo, sino de no trasponer la rezagada posición española al conjunto de la UE. Y titulares vacuos del tipo España tendrá 5G antes de lo esperado no ayudan cuando todas las previsiones de adopción globales están siendo superadas y reestimadas al alza de cara al futuro.

Idea 3. Dejen de pensar que la posición española en un tema equivale a la posición europea. Europa y la UE son mucho más grandes que España y raramente se puede extrapolar ni en un sentido ni en el contrario, ni para bien ni para mal. Esto son cosas básicas que debieron aprender en el instituto, pero como veo que sigue pasando pues lo repetimos para la posteridad: dejen de extrapolar datos allá donde ya no son extrapolables.

Privacidad, tecnología, y el nuevo mundo salvaje

Una interesante artículo de Maciej Cegłowski en Idle Words titulado The New Wilderness y que contiene un montón de pasajes reseñables.

Cegłowski hace un gran ejercicio resumiendo por qué no es bueno dejar que sean Google y Facebook quienes moldeen las leyes sobre privacidad. Puede parecer obvio a cualquier lector de este blog que no es buena idea dejar al lobo a cargo de las gallinas, pero a falta de otras propuestas, el regulador seguro les prestará atención a ellos. No se me ocurren agentes peores a quien delegar esa función, en realidad.

Usa el concepto de privacidad ambiente:

Until recently, ambient privacy was a simple fact of life. Recording something for posterity required making special arrangements, and most of our shared experience of the past was filtered through the attenuating haze of human memory. Even police states like East Germany, where one in seven citizens was an informer, were not able to keep tabs on their entire population.

Imposible no recordar algunos textos aparecidos en este blog durante los años la muerte de la conversación efímera (2006), algunas notas dedicadas al poder comparado de la tecnología actual con el de la Stasi (2010), o las sabias palabras del malogrado Pepe Cervera que he citado en multitud de ocasiones: el abaratamiento de la tecnología hace posible ciertos sueños represivos.

Un poco después continúa:

My own suspicion is that ambient privacy plays an important role in civic life. When all discussion takes place under the eye of software, in a for-profit medium working to shape the participants’ behavior, it may not be possible to create the consensus and shared sense of reality that is a prerequisite for self-government. If that is true, then the move away from ambient privacy will be an irreversible change, because it will remove our ability to function as a democracy.

Y esto me hace pensar en el futuro de las democracias liberales como las conocemos, y en lo que reflexionamos al hilo de aquella conversación entre Harari y Friedman.

Luego realiza una comparativa de lo que él considera necesario acerca de la privacidad con lo acontecido en regulación medioambiental con la que no estoy seguro si estoy de acuerdo o si tan solo ha hilado sus argumentos de forma que me ha tendido una trampa. Por ejemplo, este párrafo:

We’re at the point where we need a similar shift in perspective in our privacy law. The infrastructure of mass surveillance is too complex, and the tech oligopoly too powerful, to make it meaningful to talk about individual consent. Even experts don’t have a full picture of the surveillance economy, in part because its beneficiaries are so secretive, and in part because the whole system is in flux. Telling people that they own their data, and should decide what to do with it, is just another way of disempowering them.

Por una parte es cierto que lo hecho hasta ahora es o inútil o directamente contraproducente. La GDPR, al definir consentimiento de forma tan endeble como pulsar un botón con texto engañoso al que hay que llegar buceando entre páginas de texto legal demuestra lo inútil y perverso de la regulación actual. No soluciona el problema y ampara legalmente a quienes visiblemente abusan de su posición.

Sin embargo, no estoy seguro de que emular el pensamiento mediambiental sea la solución. Por el solo hecho de que no podemos desinventar la rueda y es una realidad que cada vez habrá más computadoras en nuestros bolsillos, recogiendo y enviando a servidores ajenos cada vez más datos. Pronto necesitaremos más de 30 gigas de datos al mes en nuestra conexión móvil. Eso es lo que hacen los ordenadores: generar y clasificar datos.

En cualquier caso, una gran lectura que recomiendo y sobre la que si tengo ocasión de seguir reflexionando quizá vuelva a escribir.

Diferencias entre Data Scientist, Data Engineer, y Data Analyst

Hay un barullo bastante grande con algunas de las nuevas palabras clave laborales de moda, y en concreto con tres de ellas que contienen la palabra Data. En el post de hoy intentaré explicar, de forma muy sucinta, la diferencia entre un data scientist, un data engineer, y un data analyst.

Escribo este post porque con frecuencia veo confusión en el uso de los mismos, incluso en ofertas de empleo – lo que es especialmente grave. Me sucedió hace poco que me llamaron de una empresa para saber si me interesaría cambiar de proyecto y yo estoy muy contento donde me hallo ahora mismo, pero no voy a descartar una opción antes de oirla en detalle, porque nunca se sabe.

El asunto es que a pesar de que dijeron buscamos velocidad, cuando me describieron las funciones resultan que lo que buscaban era tocino. Yo me dedico a la velocidad, pero no al tocino, así que no llegó muy lejos aquella conversación. Intentemos, aunque sea simplificando mucho las descripciones (¡un párrafo por rol!), que eso no se repita.

Data Scientist

Está implicado en el desarrollo de modelos matemáticos y algoritmos para explotar datos y obtener nueva información de ellos. Esto requiere conocimiento de bases de datos, ya que es de esas bases de datos de las que hay que extraer información que serán procesados o actuarán como entrada a nuestro modelo matemático. Nociones básicas de programación para implementar versiones básicas de los modelos y los algoritmos desarrollados también son clave.

Conocimientos clave: matemáticas, SQL, Python, R.

Data Engineer

Está implicado en el desarrollo del software que ha de procesar los datos tanto que actuarán de entrada a los desarrollos de los data scientist como de almacenar la salida procesada, el resultado del trabajo. Es de los tres roles que tratamos hoy el que más se alinea con el puesto de desarrollador de software de toda la vida, si bien es un desarrollador de software con conocimientos en sistemas de big data.

Conocimientos clave: Scala, Python, Hadoop (y toda la utillería habitual de big data), Spark.

Data Analyst

Es un rol más próximo al desarrollo de negocio. Su función es interpretar datos (también los datos de salida de los sistemas desarrollados por los Scientist y los Engineer) y extraer a partir de ellos conclusiones e implicaciones para el mundo real que faciliten la toma de decisiones de negocio correctas.

Conocimientos clave: estadística, software de generación de reports (Tableau, Qlikview), hojas de cálculo, algo de SQL.

El hilo que va desde el ajedrez al coche autónomo

Tesla Model S

Leí hace unos días uno de esos artículos sobre coche autónomo que me hacen sonreir ligeramente, de forma casi imperceptible.

Resulta que con los datos en la mano el piloto automático de los Tesla actuales es menos competente que un humano y hay a quien parece que eso deba ser recalcado, quizá con idea de que esa percepción de incapacidad técnica cale entre el público objetivo.

Entonces me dio por pensar que en los años noventa, algún periodista debió escribir algo parecido acerca de cómo los ordenadores eran incapaces de ganar a los mejores jugadores del mundo de ajedrez. Seguro que cuando Kasparov ganó la revancha a Deep Blue también lo escribieron. Recordé entonces que hace ya unos quince años que el mejor humano (entonces, Ponomariov) derrotó por última vez a la mejor máquina para jugar al ajedrez, como conté en su día; y que eso ya jamás volverá a suceder.

Entonces, como ya se imaginan, se me pintó la sonrisa casi imperceptible que les comentaba. La pregunta no es si los coches conducirán mejor que las personas, sino cuándo.

Voto cuadrático

En Bloomberg hablan de lo que llaman voto cuadrático, un curioso invento bastante nerd que han probado en Colorado (Estados Unidos) y parece que con buen resultado:

The tool is called quadratic voting, and it’s just as nerdy as it sounds. The concept is that each voter is given a certain number of tokens—say, 100—to spend as he or she sees fit on votes for a variety of candidates or issues. Casting one vote for one candidate or issue costs one token, but two votes cost four tokens, three votes cost nine tokens, and so on up to 10 votes costing all 100 of your tokens. In other words, if you really care about one candidate or issue, you can cast up to 10 votes for him, her, or it, but it’s going to cost you all your tokens.

Según explican, la idea es medir si las intensas preferencias de una minoría pesan más que las preferencias suaves de una mayoría.

Con las cifras del ejemplo anterior, un elector convencido podría emitir 10 votos por una única opción, o un máximo de 100 votos repartidos entre sendas opciones.

Parece una forma correcta de mitigar los efectos del pensamiento más sectario o intransigente en favor de una visión más compensada y repartida que sea capaz de apoyar a otros candidatos.

The Coddling of the American Mind

Hace cosa de un mes terminé The Coddling of the American Mind, de Jonathan Haidt y Greg Lukianoff, y llevo desde entonces queriendo sacar una nota al respecto en el blog, pues creo que es un libro excelente. Hay una web que acompaña al libro que también es muy recomendable.

El título y el subtítulo del libro te dan una idea de por dónde van a ir los tiros: La sobreprotección de la mente americana: cómo buenas intenciones y malas ideas están configurando a una generación para fracasar.

El libro de Haidt es, sin duda alguna, lo mejor que he leído en bastante tiempo. Un análisis pormenorizado del devenir contemporáneo, con especial foco en la transformación de las instituciones universitarias, otrora avatares de la libertad de pensamiento y cada vez más reductos donde sus integrantes (tanto profesores como alumnos) esperan encontrar únicamente confirmación a sus ideas, sin ser estas cuestionadas ni sometidas a escrutinio.

No son los millenials, estúpido

Una cosa que Haidt explica muy bien es que pese a que el término millenial se ha convertido ahora en meme-parodia de todo lo que se quiera ridiculizar (creo que en eso ha sustituido las referencias al cuñadismo de hace unos años), los problemas derivados de la sobreprotección de los jóvenes no se manifiestan con la llegada de los millenials a la vida adulta, sino con una generación posterior que ha crecido masivamente con Internet en sus bolsillos.

Haidt llama a esta generación la iGen, y la define de forma que quienes nacieron un poco antes del cambio de siglo (en torno a 1995) forman parte de ella. Son personas que llegan a la edad adulta en la década que ahora terminamos, a partir de 2013 si sumamos desde la fecha mencionada arriba.

Una característica clave para entender a esta nueva generación es que es la primera que ha pasado los años clave de su desarrollo personal (la adolecencia) con mucha menos interacción directa y menos actividades no supervisadas (como jugar en la calle sin un adulto que supervise el juego y resuelva los conflictos entre niños) que cualquier generación anterior en toda la historia.

El resultado son jóvenes adultos que no saben resolver conflictos sin un mediador, que es uno de los motivos por el que aflora la continua y reiterada petición de normas, reglas, y autoridades que estipulen lo que se puede y no se puede hacer; básicamente, son niños pidiendo a adultos que pongan orden donde ellos no son capaces.

Se puede hilvanar estas ideas con partes de Lanier, Stallman o Lessig. Todos ellos nos avisaron del peligro de que los humanos sucumban ante la mediación de las computadoras. Desde la influencia desmesurada de quien controla el software (Stallman, Lessig) a las limitaciones que derivan del hecho de dejar que el software establezca los matices de tu pensamiento (Lanier). En realidad, todo lo argumentado por Haidt viene a ser una descorazonadora confirmación de que está sucediendo lo que anticipaban todos estos pensadores. Suelo tratar estos temas en el blog.

Podría extenderme mucho más, el libro da para ello con temas como una crítica extensa a Marcuse y a las ideas que heredaron de su pensamiento (como todo lo relacionado con la interseccionalidad), incluyendo toda esa fijación posmoderna en que el consenso construye la verdad de forma subjetiva y que para solucionar problemas basta con cambiar de nombre a los mismos, en lugar de atajarlos de raíz. Pero entonces me alargaría demasiado y les robaría tiempo que, humildemente, les recomiendo gastar leyendo este libro.