Saltar al contenido

Posts from the ‘Conocimiento’ Category

Crónica de un fin de semana – Analizando Patentes

¿Es posible el analizar las patentes que van siendo aprobadas para encontrar patrones y predecir el futuro? Intentar responder esta pregunta me hizo perder alrededor de 30 horas en un fin de semana.

Aunque obviamente no pude encontrar la manera de analizar las patentes (y estoy exageradamente lejos de lograrlo), el intentar responder mi pregunta me hizo descubrir varios servicios muy interesantes que compartiré con ustedes en este post.

¿Cómo crear una araña web?

Una araña web (web crawler en inglés) es un programa que analiza páginas de Internet de manera metódica y automatizada. Google usa arañas web para extraer contenido, indexarlo y proveer resultados de búsqueda. El intentar crear una araña de web para extraer información de la página de patentes de Estados Unidos me hizo descubrir el servicio de 80legs.com. Esta empresa permite a cualquier usuario el crear arañas de manera gratuita sin la necesidad de saber programar. Aquellos que quieran extraer todo el texto de un directorio pueden usar los servicios de esta página. Obviamente antes de hacerlo deben de investigar si es legal hacerlo.

¿Cómo automatizar tareas?

Si bien es cierto que se puede usar 80legs para extraer contenido de la página de patentes, los servicios de esta página no eran lo suficientemente rápidos ni me ofrecían las opciones que yo necesitaba para mi análisis. Por tal motivo decidí investigar alternativas y descubrí un programa llamado irobot (que se puede descargar de http://irobotsoft.com/). Este programa tiene una interface relativamente sencilla y permite automatizar tareas como el llenado de formas, abrir páginas de internet y grabar información en una base de datos. El único problema de este programa es que requiere un poco de conocimiento de HTQL. Afortunadamente, no es tan complicado el aprender HTQL si se tiene conocimiento de HTML. Con irobot pude crear una base de datos que contiene los resúmenes, autores y fecha de publicación de las patentes relacionadas a mercadotecnia que se crearon en los últimos años.

¿Cómo analizar texto?

Tras crear una base de datos con información sobre patentes mi siguiente reto fue el analizar dicha información. Tras hacer una búsqueda en Google y leer varios artículos sobre análisis de textos, encontré los servicios de AlchemiAPI.com. En esta página puedes poner texto y recibir los conceptos claves del texto y relaciones entre palabras. Una vez que identifique los términos relevantes en mi base de datos de patentes, decidí ver cuántas veces aparecía cada concepto en cada patente y usar un algoritmo para crear clústers (k-means) para encontrar patrones. Para mi tristeza no encontré nada interesante.

¿Cómo encontrar patrones?

Mi frustración me hizo buscar empresas que hagan todo el análisis de una base de datos. Buscando en Internet encontré que Google ofrece una herramienta para analizar Big Data. A través de un API que se encuentra en la página https://developers.google.com/prediction/, es posible el analizar bases de datos y hacer predicciones. Lo único que se requiere para lograr este objetivo es una base de datos que contenga datos para generar un modelo (supongo que Google usa neural networks para hacer sus predicciones). Leer esto me hizo acordarme de Mechanical Turk (servicio del cual escribí aquí hace algunos días) para crear el archivo de entrenamiento. No obstante, este proyecto tomaría demasiado esfuerzo y creo que no tengo tiempo suficiente para hacerlo. Fue a esta altura (y tras haber pasado mucho tiempo frente al monitor) cuando decidí rendirme.

¿Malgasté un fin de semana?

Espero que no. Si bien es cierto que uno de mis amigos me preguntó ¿Y qué lograste con todo esto? Y no pude responderle, creo que algún día podré conectar todas estas herramientas que estoy descubriendo.  A final de cuentas vine a la escuela a aprender algo nuevo.

¿Cómo usar Amazon para obtener respuestas?

Para aquellas personas que no están familiarizadas con Mechanical Turk. Este es un servicio ofrecido por Amazon en el cual personas realizan tareas que una computadora no puede hacer a cambio de un pequeño sueldo (i.e. centavos) por cada tarea.

Para dar un ejemplo, empresas que desean describir o clasificar una foto, pueden usar Mechanical Turk para tener acceso a cientos de personas alrededor del mundo que reciben un sueldo por cada foto que analizan.

El pensar que es posible tener acceso a cientos de cerebros humanos a cambio de centavos me hizo preguntarme…  ¿Por qué no usar Mechanical Turk para obtener respuestas?

Los post que escribí titulados ¿De qué te arrepientes en esta vida? y ¿Cuáles eran tus sueños de pequeño? Los hice con respuestas que obtuve de Mechanical Turk. El proceso fue extremadamente fácil y no requiere conocimiento alguno de programación. Solamente fue necesario llenar una forma, decir cuánto dinero estoy dispuesto a pagar por respuesta y esperar mis respuestas.

Por menos 5 dólares me fue posible construir una base de datos con 200 respuestas. Para mi experimento decidí usar solamente respuestas de personas de Estados Unidos y la verdad quedé asombrado por la calidad y rapidez del servicio que proveen los individuos que participan como empleados.

La próxima vez que necesiten una respuesta y que estén pensando en hacer una encuesta informal, les recomiendo que usen Mechanical Turk en lugar de poner un link en Facebook y obtener respuestas de sus conocidos.

La mercadotecnia del futuro

Desde hace varios años se han ido presentado cambios en la industria y función de la mercadotecnia. La abundancia de la información, las redes sociales, y los nuevos modelos de negocio se han encargado de hacer obsoletos los departamentos tradicionales de mercadotecnia.

Según Forrester 75% de los CMOs (Chief Marketing Officers) afirmaron que iban a hacer cambios drásticos en sus departamentos a finales del año pasado y según Accenture solamente 4% de los gerentes de mercadotecnia se sienten preparados para explotar oportunidades que surgen por las tecnologías digitales.

Tras realizar un pequeño experimento en Linkedin, en el cual me puse a examinar las posiciones de “Gerente de Mercadotecnía” (i.e. Marketing Manager) que estaban publicadas el 17 de Enero del 2012 (día que hice el experimento) fue impresionante ver las habilidades que son requeridas por las empresas.

La gráfica nos muestra el porcentaje de las vacantes que contenía cada palabra/habilidad. Las barras rojas son conceptos que por lo general son asociados con mercadotecnia (i.e. precios, segmentos, marca, etc.) mientras que las barras rojas son habilidades o palabras que son asociadas con tecnología.

Sobra decir que vivimos en un mundo dónde Search Engine Optimization (SEO) es tan importante que tener conocimientos sobre Branding.

Adwords, SQL, HTML…

¿Cuántas de estas habilidades poseen los profesionistas actuales?

Las patentes destruyen la innovación.

Nunca me imaginé que escribiría una entrada con este título. Hasta hace un par de meses pensaba que las patentes cumplían con su misión de proteger a los inventores y que fomentaban la investigación y creación de conocimiento. No obstante, una serie de artículos que han sido publicados en las últimas semanas me hace pensar que las patentes están destruyendo la cultura de innovación en Estados Unidos.

Para dar algunos ejemplos:

  • Google gasta miles (quizás millones) de dólares creando el sistema operativo Android y lo ofrece gratis a las empresas de telecomunicaciones alrededor del mundo. Microsoft le compra 6,000 patentes de telefonía móvil a Nortel y amenaza a todas las empresas que usan Android (e.g. Samsung, Motorola, HTC, etc.) de demandarlas si no le pagan una regalía. Es decir, Google crea el producto y Microsoft hace dinero extorsionando  (de una manera elegante) a las empresas que lo usan. (Ver artículo y artículo).
  • Spotify, una empresa que ofrece música gratis de manera similar a Pandora.com, inició sus operaciones en Estados Unidos hace dos semanas. Hace dos días esta empresa fue demandada por PacketVideo ya que ellos tienen una patente de “distribución de música a través de Internet”. Lo interesante del asunto es que PacketVideo no ha creado ningún producto que ofrece música a través de Internet y que la patente que se está usando para demandar a Spotify fue comprada a un tercero. (Ver artículo)
  • Hace unos días, NPR publicó un reportaje sobre Intelectual Ventures. Esta empresa compra patentes al por mayor para vendérselas a empresas que usan estas patentes para demandar a empresas de tecnología. Lo sucio del asunto no termina ahí ya que Intelectual Ventures también renta sus patentes a las empresas de tecnología para protegerse de demandas. (Ver artículo)

Según un estudio realizado por un profesor de Stanford (ver estudio), el sistema de patentes de Estados Unidos aprueba 200,000 patentes cada año y muchas de estas patentes son para productos similares ya que la invención de nuevas tecnologías por lo general ocurre de manera simultánea.

Si este es el caso (y existen duplicados de patentes para cada invención)… ¿De qué sirve tener patentes?

Everything is Obvious* (Duncan Watts) – Libro

El día de ayer terminé de leer el libro “Everything is Obvious: Once you know the answer” de Duncan Watts y lo recomiendo ampliamente para cualquier persona que trabaje en una industria que requiera analizar información y tomar decisiones.

El autor, un investigador de la Universidad de Columbia y de Yahoo, demuestra en este libro las limitantes del sentido común. Para aquellos que les interesa este tema, puedo decir que este libro es muy similar a “Stumbling on Happiness” de Daniel Gilbert. No obstante, a diferencia de otros libros que cubren temas similares, este libro no se centra en tan sólo una idea (e.g. Nudge), en dar simplemente ejemplos (e.g. Predictable Irrational) o en tan sólo una industria (e.g. Fooled by Randomness) sino que explica con un marco teórico las falacias que cometemos todos los días. El autor da ejemplos de lógica circular que cometemos frecuentemente y maneras de prevenirla.

Algo muy interesante de este libro es que critica directamente al libro “The Tipping point” de Malcom Gladwell. Tras haber leído ambos libros, debo decir que los argumentos de Watts son mucho más sólidos y profundos que los de Gladwell. Asimismo, contrario a Gladwell, que cubre tanto los orígenes de la mostaza como los secretos del éxito, Watt es un sociólogo que ha dedicado muchos años de su vida a cubrir este tema.

A continuación les pongo un fragmento de este libro…

Common sense tells us that only one future will actually play out, and so it is natural to want to make specific predictions about it. In complex systems, however, which comprise most of our social and economic life, the best we can hope for is to reliably estimate the probabilities with which certain kinds of events will occur… Common sense also demands that we ignore the many uninteresting, unimportant predictions that we could be making all the time, and focus on those outcomes that actually matter. In reality, however, there is no way to anticipate, even in principle, which events will be important in the future. Even worse, the black swan events that we most wish we could have predicted are not events at all but rather shorthand descriptions of what are in reality whole swaths of history.

¿Cómo ahorrar?

El día de ayer alguien me preguntó… ¿Qué me recomendarías para empezar a hacer un ahorro considerando que hay que empezar desde cero? Esta pregunta me dejó perplejo ya que es muy compleja. De hecho, me tomó un día el pensar sobre los elementos necesarios para responderla.

A continuación les pongo la respuesta que brindé. Debo aclarar que mi respuesta está simplificando y generalizando muchos conceptos de finanzas. En la vida siempre hay excepciones y este post no es la excepción. No obstante, creo que las ideas generales que se muestran en mi respuesta pueden ayudar a aquellas personas que no tienen conocimientos de finanzas.

¿Cómo ahorrar?

Creo que esta pregunta se divide en dos partes. La primera implica cómo ajustar nuestro estilo de vida para poder ahorrar y la segunda que se refiere a cómo invertir el dinero que ahorramos.

1) Cómo ajustar nuestro estilo de vida para poder ahorrar

No es fácil responder a esta pregunta. Ahorrar es muy similar a bajar de peso. “Solamente” se requiere de fuerza de voluntad. Desgraciadamente, para la mayor parte de nosotros, es muy difícil el disminuir nuestro nivel de consumo actual y por lo tanto nunca logramos ahorrar.

Según lo que he leído, una forma relativamente fácil de ahorrar es empezar de manera conservadora. En lugar de querer ahorrar 20% de nuestro sueldo, quizás deberíamos empezar con 5% o 10%. No obstante, es muy importante que cada vez que recibamos un aumento de sueldo, destinemos la mayor parte de este aumento a nuestra cuenta de ahorros. Es decir, si al final del año recibo un aumento de sueldo de 1000 pesos al mes, lo ideal sería destinar la mayor parte de estos 1000 pesos a nuestra cuenta de ahorros. Dado que nuestro estilo de vida todavía no se ha ajustado a estos mil pesos adicionales, es más fácil el tener la fuerza de voluntad para ahorrarlos. Lo mismo aplica con los aguinaldos, bonos y regalos. Es más fácil el destinar una porción considerable de estas fuentes de ingreso que el disminuir nuestros gastos mensuales. Si empezamos a hacer esto el día de hoy, en unos 10 años vamos a llegar al punto en el que vamos a estar ahorrando un buen porcentaje de nuestro salario sin darnos cuenta.

Por otro lado, otra cosa que también ayuda mucho es el “automatizar” nuestras finanzas. Algunas cuentas de banco o fondos de inversión nos permiten realizar transacciones mensuales de manera automática. Si le decimos a nuestro banco que el día último de cada mes debe transferir X cantidad de pesos a nuestra cuenta de ahorros, es más fácil el mantener la disciplina de ahorrar.

2) Cómo invertir lo que ahorramos

Antes de invertir, debemos asegurarnos de no tener deudas. De nada sirve invertir en Cetes o en acciones y obtener un rendimiento del 10% si nuestra tarjeta de crédito nos está cobrando 20% de intereses. El único caso en el que no conviene pagar las deudas es si la tasa de interés que tenemos que pagar es menor al rendimiento de nuestras inversiones.

Una vez que hemos eliminado nuestras deudas, tenemos que decidir cómo invertir el dinero. Resumiendo todas las clases de finanzas que he tomado, puedo decir que…

  1. Nadie, absolutamente nadie puede predecir el mercado. Los mejores fondos de inversión del 2010 van a ser son los peores fondos en el 2011. De nada sirve que un grupo de 10 premios Nobel administren tu dinero o que una persona con conexiones importantes en Wall Street lo haga. El mercado de valores es totalmente aleatorio y es imposible de predecir. Aunque esto es muy obvio y la evidencia es demasiado sólida, muy pocas personas quieren admitirlo (particularmente aquellos cuyo trabajo es escoger acciones y vender sus servicios).
    Leer más

Resiliencia

Me siento orgulloso de haber encontrado una nueva palabra. Hasta hace varios años la palabra “resiliencia” no aparecía en el diccionario de la Real Academia Española. Recuerdo haber usado traductores para encontrar la traducción de “Resilience” al español. No obstante, la respuesta que me daban los motores de búsqueda (“Resiliencia”) no aparecía en el diccionario de la Real Academia.

El día de hoy decidí repetir esta búsqueda y para mi sorpresa me acabo de enterar de que esta será una nueva palabra que se va a incluir en la vigésima tercera edición del diccionario de la lengua española. Según Wikipedia esta edición va a publicarse en el 2013 y supongo que esta palabra ha sido añadida debido a que se ha popularizado lo suficiente como para ameritar su espacio en este libro.

Resiliencia se refiere a la capacidad que tiene un material de regresar a su estado original tras haber sido expuesto a un cambio o una deformación y el contar con esta palabra me permite escribir el siguiente párrafo:

Esta mañana cuando comencé clases pensé que necesitaría una semana para volver a adaptarme. No obstante, son las 12 de la noche y siento como si ya hubieran pasado días y no horas desde que regresé a la escuela. Es realmente asombrosa la manera en la cual opera el cuerpo y la mente humana. La RESILIENCIA que mostramos ante los cambios en nuestro entorno y el hecho de que todo esto ocurra sin que nos demos cuenta.

Dos videos

El día de hoy vi dos videos que me gustaron mucho porque comparten ideas que tenía en la cabeza pero nunca había podido formular ni mucho menos demostrar.

Estas dos ideas son:

1) La complejidad trae consigo simplicidad: Un problema extremadamente complejo se puede analizar de mejor manera si lo vemos en perspectiva en lugar de usar un modelo simple de causa-efecto. Esto es demostrado en un video de 3 minutos de Eric Berlow en el cual se analiza la guerra en Afganistán.

2) Saber matemáticas involucra mucho más que hacer cálculos: Conrad Wolfram propone enseñar a los niños a usar computadoras para resolver problemas de matemáticas en lugar de usar el método tradicional de resolver problemas a mano. Según Conrad, saber matemáticas involucra:

  1. Saber hacer las preguntas correctas
  2. Formular un problema basado en las preguntas
  3. Hacer los cálculos necesarios para resolver el problema
  4. Verificar la respuesta

Las escuelas enfocan todos sus esfuerzos en el tercer paso. Irónicamente este es el único paso que las computadoras pueden hacer sin nuestra ayuda. Por tal razón, ¿Por qué no enfocar nuestra energía en  enseñar a los niños a hacer las preguntas que valen la pena?

El video de Eric Berlow (complejidad) se encuentra aquí y el de Conrad Wolfram (Matemáticas) acá.

La ley del Mínimo Esfuerzo (La regla del 80/20)

Dicho principio afirma que 20% de un fenómeno es explicado por 20% de las causas. Si queremos traducir este principio a nuestra vida diaria, bien podemos decir que 20% de nuestro esfuerzo nos va a traer 80% de los resultados.

La regla del 80/20 es muy común en el mundo de la consultoría. Los consultores por lo general utilizan el principio de Pareto todos los días ya que una de las partes más importantes de su trabajo es identificar la cantidad mínima de evidencia que es suficiente para probar o refutar una hipótesis.

Leer más

Cálculos servilleteros

Dado que recibí un par de preguntas sobre la metodología que utilicé para afirmar que 7 personas morirán en los siguientes 10 años, anexo describo la manera en la que obtuve este número y los supuestos utilizados.

Supuestos:

  • Los lectores de este blog son mexicanos o tienen la expectativa de vida de un mexicano.
  • Este espacio es leído por personas mayores a 15 años y las personas que leen este espacio siguen la misma distribución que la pirámide poblacional del 2010.

Usando estos supuestos tomé las tablas de vida publicadas por el Consejo Nacional de Población (CONAPO) que contienen la probabilidad de morir en cada año (del 2005 al 2050) para hombres y mujeres de distintas edades.

Para cada edad y sexo utilicé la misma fórmula:

Probabilidad de que una persona de 15 años siga viva en 10 años = (1 – probabilidad de morir a los 15 años en el 2010) * (1- probabilidad de morir a los 16 años en el año 2011) * (1 – probabilidad de morir a los 17 años en el año 2012) * (1 – probabilidad de morir a los 18 años en el año 2013)…. Etc.

Una vez que obtuve la probabilidad de que una persona de cada sexo y edad siga viva en los siguientes 10 años, comparé la población total en cada rango de edad con la cantidad de personas que morirán. Esto me permitió llegar a la conclusión de que 93 personas de cada 100 seguirán vivas.

Iba a anexar un archivo de Excel con la metodología utilizada pero parece ser que no puedo hacerlo en WordPress. Si encuentro la manera de hacerlo lo subiré a este espacio.

Obviamente hay formas en las cuales se puede refinar este número ya que se asume que la penetración de internet es independiente de la edad de una persona. Asimismo dado que no soy actuario, no estoy seguro si hay mejores metodologías de estimar lo que me propongo.

Seguir

Get every new post delivered to your Inbox.