Mark Zuckerberg y Lex Fridman: inteligencia artificial, realidad aumentada y el futuro de Meta

Lex Fridman es un investigador ruso del MIT, especializado en ciencias de la computación. Es conocido por su podcast “Lex Fridman Podcast” en el que ha entrevistado a personas como Elon Musk, Magnus Carlsen y Sam Altman (CEO de OpenAI, los creadores de ChatGPT).

Con Lex tenemos intereses similares:

Es cinturón negro en Brazilian Jiu Jitsu (o BJJ); yo tengo 3 cinturones menos.
Entrevistó a Magnus Carlsen y Hikaru Nakamura, estrellas del ajedrez. Yo entrevisté a Cristóbal Henríquez, el mejor ajedrecista de Chile.
Él entrevistó a un ex espía ruso de la KGB; mi película favorita es Mini espías 3.

En el último año, Lex ha estado en la polémica tuitera y de reddit: al parecer los académicos lo encuentran “tan solo un influencer” y han cuestionado su verdadero rol en el MIT. Entre los ataques se dijo que hacía un curso tipo “de verano”, en el que cualquiera puede ser profesor, que sus descubrimientos no tienen revisión de pares y los manda a la prensa de una, y que básicamente no entiende lo que está hablando.

Si bien soy su fan, también me he cuestionado su legitimidad, pero la calidad de sus invitados siempre me lleva a escuchar sus capítulos. Ya sea el famoso podcaster y comediante Joe Rogan (y también gran comentarista de artes marciales) o John Danaher, uno de los entrenadores de BJJ más exitosos de la historia, siempre me aparto 3 horas de concentración profunda para oír su aburrido tono de voz.

La entrevista de Lex Fridman a Mark Zuckerberg

La semana pasada publicó su segunda entrevista a Mark Zuckerberg, cofundador y CEO de Facebook (que hoy se conoce como Meta Platforms y es dueña de Facebook, Instagram y WhatsApp).

Recuerdo haber escuchado la primera entrevista de Lex con Mark Zuckerberg y me llamó mucho la atención cuando hablaron del Metaverso y la realidad virtual. En particular, cuando explicó el desafío de sentir realmente las partes de tu cuerpo como propias, al verlas en esta realidad alternativa. Zuckerberg explicó que la rotación y movimiento de los codos era un desafío para que se sintiera natural, y que habían llegado a la conclusión que se sentía más normal ver tus propias manos sin brazos ni codos, que tener ese movimiento o rotación extraña.

Con toda la revolución de la inteligencia artificial, los modelos de lenguaje, la realidad aumentada y el reciente lanzamiento de los Apple Vision Pro, escuchar esta conversación seguro nos puede dar indicios de hacia dónde van los avances, y los celos o reparos que puede tener Meta hacia la competencia que le hará Apple. ¿Y qué mejor que escuchar la primicia en palabras de uno de sus principales propulsores? La conversación dura 2 horas 40 minutos, por eso encontré útil hacer un resumen de los puntos más interesantes, por si no tienes tiempo de escucharla.

Zuckerberg y el Brazilian Jiu Jitsu

El podcast parte en las oficinas de Meta, cosa poco común porque Lex suele grabar las entrevistas en su estudio. Supongo que si viajó para hacerla, tenía harto interés en sacarla. En los primeros minutos ya me había conquistado: Lex trae a la conversación el BJJ y si bien Zuckerberg no es un tipo muy de mi agrado, al igual que yo dice que prefiere el BJJ sin kimono. Lex le pregunta sobre su reciente competición y ambos analizan la vergüenza de perder. Relacionan el arte marcial con la vida y el manejo de una compañía como Meta. Saber perder, rendirse a tiempo y fallar, es parte del proceso de aprendizaje. Los puntos que dijo Mark que más me llamaron la atención de esta parte de la conversación fueron los siguientes:

Tanto en una lucha de BJJ como en el manejo de una compañía, sabe lidiar con momentos de estrés y tiene “buena guata” para las decisiones, ya sea para no moverte a una posición de desventaja o para no tomar decisiones que lleven a la compañía en la dirección equivocada.
En los momentos difíciles de una compañía, si tienes un equipo cohesionado puedes llegar a donde quieras. Cuando hay tensión y las cosas se ponen complicadas, las personas y los equipos son muy importantes. Esos lazos se construyen estando mucho tiempo unidos, siendo abiertos y escuchándose.

Al igual que en una empresa, el secreto para avanzar en el BJJ es el empuje. Te vas a caer. Hace una analogía interesante con el surf: no todas las olas son buenas, hay que saber escogerlas y también saber que no todas las vas a poder surfear bien. También es importante entender hasta dónde empujar porque ser terco te puede hundir.

Meta y la inteligencia artificial

Cuando Lex trae la inteligencia artificial y Meta a la conversación, Mark inmediatamente le da un protagonismo al rol que ha tenido su empresa: dice que han tomado un enfoque más abierto y académico en estas materias. Por una parte para poder tener a las mejores personas (ellas quieren compartir sus logros) y por otra, tienen un gran empuje hacia el código abierto (open source), que lleva a un producto más seguro, innovador y transparente, y no a través de la seguridad por oscuridad. Ojalá esto se transmita a otros productos, comenta, quizás tirando un elegante palo para el icónico estilo cerrado de los productos de Apple.

La entrevista cuenta cómo en febrero Meta decidió abrir LLaMA (su modelo de lenguaje). Lo hicieron solo para investigadores y sin licencia comercial, pero se filtró.

A lo que Lex arremete con buenas preguntas: ¿Y el futuro del Open Source? ¿Van a mostrar la receta mágica de LLaMA? ¿Van a entregar una herramienta poderosa de la que se podría hacer mal uso? Y a Zuckerberg no lo intimida el entrevistador, se sabe sacar bien las preguntas:

LLaMA aún no está al nivel de ser una herramienta poderosa o alcanzar la super inteligencia. Tampoco manejan datos sensibles (a diferencia de Whatsapp o un medio de pago).
LLaMA será open source y el debate interno es sobre cómo hacerlo. En esta primera versión se han enfocado en tener todas las medidas de seguridad del estado del arte actual.

En sus palabras, el código abierto también permite lograr un modelo más alineado porque hay distintas personas probando cosas y viendo cómo mejorarlo. Lex aprovecha este puente hacia el crowdsourcing y cómo el feedback humano fue de mucha importancia para las mejoras de GPT-3 a GPT-4.

Hacer finetune de forma masiva sería bueno si tuvieras una forma colaborativa y con manejo comunitario como lo hace Wikipedia, pero hay muchos desafíos aún, dice Mark. El secreto de Wikipedia: un grupo pequeño de editores que trabaja en conjunto, pero aun así no es perfecto. ¿Cómo eliges el grupo? ¿Qué criterios usas? En fin son muchas las preguntas pero el objetivo final es encontrar la forma de que estos modelos que dicen cosas convincentes logren la verdad.

Y qué falta para lograr la Inteligencia Artificial General (AGI), pregunta Lex?

Zuckerberg apunta a que hay dos posibles caminos: escalar los modelos actuales (ej: aumentar los parámetros que usan) o bien hacer cambios fundamentales, y el cree que esto último es lo que va a llevar estos modelos a la AGI.

Los nuevas posibilidades de negocio gracias a la IA

Lex: ¿qué nuevos productos crees que aparecerán gracias a estos modelos de lenguaje?

De acá en adelante Zuckerberg muestra la fuerte convicción que los asistentes personales de IA cambiarán la forma en que nos relacionamos en el futuro. Cree que pueden ser múltiples asistentes que nos ayuden en distintos aspectos pero la idea general es aumentar la interacción social:

Personas famosas pueden usar bots de inteligencia artificial para interactuar con sus seguidores, o que podríamos tener mentores, coaches, asistentes para programar y tutores de educación.
También cree en la generación de contenido audiovisual gracias a la IA: la generación de fotos, videos o Ads a través de texto, permitirá que negocios pequeños aprovechen al máximo estas herramientas.

Es interesante cómo este cruce entre asistencia e interacción social hace alusión al mundo personal de Zuckerberg: personas con fama, y que tienen capital y osadía para empezar su propia empresa.

¿Y el uso de estos modelos de lenguaje como asistentes de programación?

Para Mark son una base de conocimientos generales que permiten mejor calidad y consistencia en el código.

No ve un efecto negativo a largo plazo y cree que es bueno tener más herramientas para expresarse. Pone como ejemplo el motor de búsqueda Google: si bien ya no es necesario esforzarse por encontrar la información, no tenemos menos capacidades y lo hemos integrado como una herramienta a nuestro favor.

Bots, presión política y democracia según Zuckerberg

Ahora se vienen los temas más spicy de la entrevista: bots y cómo pueden ayudar a detectar estafas, pedofilia y otros crímenes en las redes sociales.

Mark comenta que tienen bien categorizadas las publicaciones o el contenido peligroso. El desafío que plantea es el criterio:

Hay crímenes que son derechamente censurados, por ejemplo la pedofilia o la estafa, pero hay categorías que son discutibles. En su minuto fueron las publicaciones asociadas al Covid: la solución para él es poner una etiqueta de alerta y dejar que la persona decida qué hacer con esa información.
Sobre las cuentas no autenticadas, Zuckerberg cree que pueden haber riesgos si están coordinadas, porque crean narrativas, no necesariamente reales, con el poder de viralizarse y en realidad es alguien que manipula. Si se viralizan cosas de forma orgánica para él no es un problema.

Ese comentario le da a Lex un perfecto pase para meter otra pregunta difícil y que refiere a la competencia: cómo manejar la presión de la política y situaciones como Twitter files.

El caso Twitter files se dio cuando Elon Musk le entregó documentos de la compañía a dos periodistas gringos. Los documentos salieron a la luz y se generó una polémica en torno a la transparencia y moderación, ya que según varias personas los archivos evidenciaban un sesgo liberal y una preferencia hacia los demócratas en las solicitudes de eliminación de tuits, listas negras, etc.

Para Zuckerberg es una empresa versus la democracia, por lo que respeta las decisiones de los distintos gobiernos. Siempre existirán presiones que son más sesgadas y son decisiones difíciles de tomar. Meta es mucho más dura con el acceso a la información por parte de los gobiernos y están muy encima de que no obtengan datos de las personas de manera ilegal. Dice que las presiones y la censura son parte del debate social.

La nota mental que se me vino a la cabeza en esta parte de la entrevista fue “Y el caso Cambridge Analytica?. No sé si lo omitió para no meterse en problemas, o de forma tácita admitió que ese caso fue un aprendizaje, y ahora se han puesto más rígidos.

La alternativa a Twitter de Zuckerberg

El proyecto P92, una nueva red social que se plantaría como alternativa a Twitter, es el tema de la próxima pregunta con la que se atreve a avanzar Lex. La forma en que se hila la conversación de manera tan coherente, hace preguntarse si existe un guión pre acordado por Zuckerberg y Friedman, y que ensayaron como una coreografía.

Mark cree que Twitter no alcanzó el potencial que él creyó que podía tener, y le gusta la interacción por texto. A diferencia de una foto en instagram, en una red social como Twitter un comentario sí puede ser contenido primario y no pasa a un segundo plano. Esa interacción es lo que lo mueve.

De manera muy tangencial discuten qué sería una red social descentralizada. Me habría gustado que desarrollaran más este punto, quizás hasta un poco de conversación sobre las criptomonedas y la opinión de Mark en este tema.

Lo anterior los lleva de nuevo a Elon Musk y su trabajo en Twitter.

Zuckerberg: uno no entiende desde afuera lo que pasa dentro de una empresa. Elon llevó Twitter desde un inicio a ser más liviano en sus principios, a eliminar tantos niveles de management, y mejorar la relación entre ingenieros y managers, entre otras cosas. Esos son buenos cambios y hacen a otros tomadores de decisión cuestionar las estructuras de sus propias organizaciones.

Zuckerberg entiende los despidos masivos como algo duro y desafiante, porque es cambiar las carreras de las personas por decisiones estratégicas y no asociadas al desempeño.

La cultura organizacional

Hablar del manejo que ha tenido Elon Musk en Twitter y la complejidad de hacer grandes despidos, los lleva a aterrizar la conversación en varios aspectos de cultura organizacional: cómo contratar equipos, el óptimo número de personas a cargo de un manager y las diferencias entre una organización en pleno crecimiento versus una compañía consolidada.

Sobre las contrataciones:

En una organización que crece rápido: contratar si tu estarías feliz trabajando para él como tu jefe en un universo paralelo
En una compañía establecida: invertir en un buen sistema de practicantes, así puedes ir viendo qué sensación te provocan mientras trabajan.

Eché de menos eso sí saber cómo contratan personas de cargos con más experiencia.

Zuckerberg toca también uno de los temas más controversiales del momento: ve el trabajo remoto como algo que llegó para quedarse.

Le dispara en el pie a su avatar del Metaverso: actualmente hay valor en la prescencialidad pero algún día no existirán brechas como las conversaciones de pasillo que hasta ahora no se pueden tener por Google Meet.

La competencia de Zuckerberg en realidad aumentada: los Apple Vision Pro

Al fin Lex nos trae la competencia a la mesa, pareciera haber planeado dejar lo mejor para el final: con todo el revuelo de los Apple Vision Pro: ¿qué es lo que se viene para su producto de realidad aumentada Meta Quest 3? Da la sensación de que Mark ha esperado esta pregunta toda su vida, la tiene muy bien preparada:

El Meta Quest 3 es un producto de alta resolución y realidad mixta. Ahora dejaron de lado el enfoque de realidad virtual. Solo cuesta 500 dólares y su misión es que sea accesible. Han mejorado mucho la evolución del producto y la disminución de precios para que llegue a más personas.
Los Apple Vision Pro podrían incluso ayudar al Meta Quest. Apple es una marca con muchos fans, y si saca este producto seguramente atraerá a mucha gente al mercado de la realidad aumentada. Meta podría salir beneficiada, ya que los Meta Quest 3 son una opción de alta calidad pero más accesible.

Esa sí que es visión sensata de competencia. Vale la pena pensar bien y ensayar una respuesta que no te deje disminuido frente a una de las marcas más relevantes del mundo.

Las amenazas de la IA y el manejo del poder

Vuelven a la IA, no sé si acá se salen del libreto porque a Lex le fascina o qué.

Lex: ¿qué amenazas hay en los sistemas de IA? ¿Teme Zuckerberg ser una persona muy poderosa por liderar estos cambios? ¿A cuánto estamos de la inteligencia artificial general (AGI)?

Zuckerberg: Los sistemas aún están lejos de la superinteligencia, ahora hay que preocuparse de que sean seguros. La preocupación debe ser en la autonomía: cosas que no son inteligentes pero son autónomas pueden ser peligrosas (ej: virus en los computadores). No le teme al poder porque ve la filosofía open source como el enfoque adecuado y que el escrutinio lo hace seguro. Sobre la AGI acabamos de vivir un quiebre en los avances en IA. Faltan muchos de estos quiebres para finalmente llegar a la AGI. Podrían ser 5, 10 años o más. No ve un quiebre próximo antes de 6 meses.

Para terminar la conversación Zuckerberg se define como alguien que tiene preocupación por lo físico y el deporte. Comenta que algún día estará la posibilidad de tener un clon de Lex y se declara como un hombre de fe. No muchos saben pero Zuckerberg el 2016 declaró que dejó de ser ateo, y que para él la religión estaba siendo cada vez más relevante.

Admira la creación de Dios y en su vida personal lo lleva al valor de crear nuevas cosas. La fe es un cable a tierra en su vida.

Mi opinión de la entrevista

Los dos tienen un tono de voz plano, y en general no es fácil estar concentrado casi tres horas seguidas. Pero valió la pena, y por eso quise resumir la entrevista. Así puedo ahorrarle a alguien esas dificultades propias del formato del podcast.

Es una conversación con uno de los líderes de la revolución que estamos viviendo, llena de perspectivas, caminos e ideas. En lo personal me hace cuestionarme todo lo que estoy haciendo, y si vamos por el camino correcto. No sería de extrañar que después de este podcast, surjan varias empresas con asistentes de inteligencia artificial, o más empresas pequeñas opten por el código abierto.

Ojalá más gente conozca el Brazilian Jiu Jitsu, pero les recomiendo se cuiden porque sino las lesiones los van a retirar (como a mí jaja).