Diálogo | Zhang Peng
Cuando todos se lanzan a desarrollar «empleados digitales» y «herramientas Agent», y se enredan sin fin en escenarios específicos, ¿dónde está realmente el verdadero moat del emprendimiento en IA?
Recientemente, Zhang Peng, fundador y presidente de Geek Park, y Liu Ye, fundador de VisionFlow, llevaron a cabo una discusión hacia adelante tras el estallido de OpenClaw. Como uno de los primeros programadores chinos nacidos en 1979, Liu Ye ha atravesado todo el ciclo desde el hardware de bajo nivel hasta el software, y desde la integración empresarial (ToB) hasta la educación en línea (internet industrial). Tras varios meses de aislamiento y conversaciones exhaustivas con investigadores de las principales empresas de IA a nivel mundial y emprendedores de élite en China, llegó a una conclusión fría: considerar la IA como un «empleado digital» para reemplazar tareas individuales es una simplificación excesiva del pensamiento de ingeniería aplicada a negocios reales.
En esta conversación, Liu Ye presentó una serie de conceptos y marcos altamente inspiradores, como la «exposición progresiva» y la «matriz de dimensiones de tareas». Durante el debate, una posibilidad futura se volvió cada vez más clara: el siguiente paso de la IA no será la proliferación de herramientas genéricas, sino la construcción de una «organización digital» con mecanismos de colaboración, reporte y reflexión. Cuando la cultura empresarial ya no sea necesaria y el trabajo de baja dimensión haya sido completamente eliminado, el futuro CEO tal vez ya no sea un «director ejecutivo», sino un «productor» con un gusto extremadamente refinado.
Esta es una exploración y simulación sobre la forma organizacional en la era de la IA, las barreras comerciales y el nicho ecológico de los nuevos emprendedores. Se espera fomentar discusiones más profundas sobre el futuro de los emprendedores.
A continuación, la versión editada de la conversación recopilada por GeekPark:
La batalla de 01万 A ya ha comenzado, hay demasiado que hacer,
Pero ¿qué es lo más importante que hacer?
Zhang Peng: Desde la caja de tareas hasta hoy, tan entusiasmado por explorar los cambios que trae OpenClaw, ¿has experimentado algún cambio personal?
Liu Ye: Soy el primer generación de programadores en China, y empecé a aprender programación desde pequeño. He atravesado la transición desde BASIC hasta DOS, luego Windows y la era actual de Mac, y he presenciado el auge de los tres grandes portales. Trabajé en la informatización empresarial con el objetivo de crear el IBM de China; más tarde cambié mi rumbo hacia Zuoyebox, participando profundamente en la educación en línea. La educación en línea es una industria profundamente significativa, la forma más elevada de la industria de internet y también el "último tren". Esta experiencia me hizo comprender profundamente que el núcleo de la industria de internet no es la tecnología, sino la industria misma, el negocio. La lógica de la industria de internet es: primero se realiza la intermediación de información, luego productos estandarizados, seguidos por la cadena de suministro y, finalmente, servicios complejos no estandarizados. Cuanto más avanzas en esta secuencia, mayor es el margen bruto, pero también más difícil se vuelve.
Entonces, cuando llegó la ola de IA, lo primero que hice fue dedicar casi seis meses a no hacer nada más que hacer entrevistas con todos los que se pudieran hablar: desde los científicos jefes de startups estrella hasta los algoritmos, ingenieros e investigadores clave de las grandes empresas de modelos base, así como emprendedores de IA emergentes. Hablé con todos los posibles interlocutores y acumulé aproximadamente mil horas de intercambios intensos. ¿Hasta qué punto llegué? Llegué a un punto en el que, cuando la otra persona decía la primera mitad de una frase, yo ya sabía cuál era la segunda mitad; ya no había muchas diferencias en los consensos entre todos.
Después de hablar con todos, la conclusión fue sorprendentemente uniforme: todos están haciendo lo mismo: empleados digitales. Esto me recordó el error estratégico de un gran líder en su momento sobre la nube, quien dijo que hacer nube en Alibaba era esencialmente lo mismo que un disco en la nube. Usar un marco antiguo para entender cosas nuevas solo te permite ver la capa más superficial.
Hoy, todos piensan que ser un empleado digital y crear un «vendedor digital» o un «servicio al cliente digital» con Claude tiene qué barreras tecnológicas? ¿Qué ventaja competitiva? Cuando quemar cientos de millones de TOKEN al día se vuelve normal, esto se parece más a la manufactura y nunca despegará. Por eso le hago a cada emprendedor la misma pregunta: ¿Por qué tú? ¿Por qué tú eres el indicado? ¿Eres más joven? ¿Más inteligente? ¿Puedes trabajar más horas? ¿Competir en una sola dimensión no es simplemente la diferencia entre «69 segundos» y «70 segundos»?
Zhang Peng: Hmm, hay demasiado que hacer hoy, pero lo más importante es saber qué hacer. ¿Tienes alguna reflexión al respecto?
02 La década de la industria de Internet se repetirá hoy
Liu Ye: La IA es muy diferente, pero creo que aún así habrá ciertas coincidencias con las leyes de la industria de Internet. En las etapas iniciales, se desarrollan herramientas; en la etapa media, se construyen negocios; y finalmente, se ofrecen servicios de consultoría. Cuando la tecnología no está madura, los primeros en entrar son sin duda los ingenieros, que tienen la habilidad de sobreabstraer el mundo, como el «cálculo por cuadro» de Baidu, que consideraba todo como un cuadro. Pero la segunda mitad de la era de Internet móvil se centró en contenido y servicios, no en cuadros.
Las personas con formación de ingeniería suelen simplificar excesivamente la comprensión de los negocios. Observa las tres grandes puertas de entrada de la primera generación de internet: las que lograron mayor éxito al final fueron Tencent y Alibaba, que estaban un poco más alejadas de la tecnología pero muy cercanas a la industria. Hoy en día ocurre lo mismo: la tecnología se está volviendo cada vez menos importante.
Zhang Peng: Este grupo de estudiantes de humanidades está bastante contento; parece que no importa si no saben programar. Pero a largo plazo, ¿qué se requiere realmente de las personas en la era de la IA? ¿Qué ha cambiado?
Liu Ye: En la estructura de talento de China, he identificado un problema. Los primeros programadores chinos eran también product managers, ya que en ese entonces no existía el cargo de product manager. El puesto de product manager se volvió ampliamente reconocido alrededor del año 2010, tras el lanzamiento del iPhone 4 por Jobs y la formulación de la filosofía de producto por Zhang Xiaolong, momento en que surgió la frase "todos son product managers". Antes de eso, los programadores asumían simultáneamente las funciones de product managers; primero llegaron los programadores, luego los product managers, por lo que los primeros programadores eran también product managers. Los primeros programadores aprendieron código no por trabajo, sino por interés; se involucraron en ello por pasión. Fueron precisamente estas personas no definidas y que se salían de lo convencional quienes resultaron más destacadas.
Pero los programadores de la segunda generación, junto con la industria de Internet de los últimos diez años, transformaron a los programadores en «campesinos del código», mientras que los productores se convirtieron en arquitectos; los campesinos del código fueron domesticados hasta el punto de no pensar en los negocios. Hoy, con la llegada de la IA, la parte del «código» ha sido eliminada; si no evolucionan, realmente solo les quedará ser «campesinos». Este grupo de jóvenes es muy talentoso, pero su comprensión de la industria es nula. Por lo tanto, la actual «guerra de los 10.000 A» es, en esencia, aún una proliferación en el nivel de herramientas.
En la etapa posterior de la internet industrial, empresas como Alibaba y Meituan utilizan de forma estándar profesionales con antecedentes en las principales firmas de consultoría (MBB) para análisis comerciales, y hacen que estos profesionales guíen a los productores de productos en los procesos de negocio, porque los productores de productos de internet carecen inherentemente de una mentalidad sistémica. Feishu se creó de esta manera. Aunque ByteDance es puramente una empresa de internet, también utiliza ampliamente firmas de consultoría para establecer procesos internos. En la era de la inteligencia artificial, esta tendencia solo se fortalecerá, no se debilitará.
03 Los problemas de la empresa nunca son problemas de empleados, sino problemas organizacionales.
Zhang Peng: Entonces, crees que el enfoque en "empleados digitales" no tiene mucho sentido.
Liu Ye: Esta es mi evaluación más fundamental: los empleados digitales no son el punto final; las organizaciones digitales sí. Si los empleados digitales se vuelven tan comunes que ni siquiera existen puestos de contratación, y todos pueden tener buenos empleados digitales, ¿qué sucede entonces? ¿Eso significa que todas las empresas podrán ganar dinero y tener éxito? En realidad, todos los problemas de las empresas son problemas de estrategia y de organización, nunca problemas de empleados.
Entonces, hoy aún el agente sigue trabajando para las personas, no tomando decisiones por ellas. Internamente, reformamos OpenClaw y creamos algo llamado MetaOrg. Es esencialmente un núcleo capaz de generar equipos de agentes. Al resolver cualquier tarea, no enviamos a un solo empleado, sino que construimos una «organización» para resolverla. Esta organización tiene relaciones de colaboración, relaciones de jerarquía, una misión, objetivos y formas de acción.
Zhang Peng: ¿Pero en el futuro, ¿es posible que una sola persona sea un departamento? ¿Incluso una empresa?
Liu Ye: Esta es una excelente pregunta. Volvamos al nivel de la tarea, por ejemplo, al usar IA para crear un corto video o redactar un documento, se requieren múltiples rondas de conversación. Dices algo, ella responde, luego le das retroalimentación; este es un uso tipo herramienta, solo es muy inteligente.
El concepto de persona y departamento no se trata de cantidad, sino de nivel. Al describir un perfil de puesto senior, generalmente decimos: primero, ser capaz de realizar tareas y diversas funciones, y utilizar diferentes herramientas. Un puesto senior, en cambio, es quien puede comprender la intención, planificar proactivamente el camino, ejecutar de forma autónoma, lograr la entrega, informar regularmente, reflexionar y resumir los resultados obtenidos, y ajustar dinámicamente la estrategia en función de las desviaciones de los resultados. Eso es lo que constituye una capacidad avanzada.
Zhang Peng: Un departamento competente debe ser como una conducción autónoma de nivel L4.
Liu Ye: Sí. Cuando le das una habilidad, puede completar tareas complejas; cuando le das un sistema de habilidades, puede completar tareas complejas e integradas; cuando se orquesta un conjunto de agentes, puede realizar cosas aún más complejas, como producir un cortometraje. A menudo les digo a mis empleados en las reuniones: cuando usen MetaOrg, no se consideren supervisores, sino presidentes. Deben esforzarse por probar sus límites.
En el futuro, los jóvenes emprenderán; antes se decía que la familia daba 500.000 para emprender, pero en el futuro podría ser que te den un presupuesto en TOKENS para experimentar. Cuántos TOKENS estés dispuesto a gastar determinará el nivel del puesto que puedas desempeñar. Cuanto más alto sea el puesto, más larga será la cadena de razonamiento y más necesitarás experimentar, iterar y resumir.
Zhang Peng: Volviendo a la pregunta anterior, si hay un grupo de agentes que se puede descomponer en unidades más finas, o bien una descomposición similar a puestos y habilidades, cuando forman un equipo y enfrentan una tarea central, la calidad individual de cada talento determina el éxito o el fracaso. Esto vuelve a la lógica de la competencia organizacional de la era anterior: la densidad de talento, es decir, tener talentos de alta calidad, hace que las tareas centrales de la organización sean más fáciles de lograr y superar.
El núcleo de este asunto es que, si en el futuro todas las IA son omniscientes y todos podemos acceder a la mejor IA, además de que las organizaciones comerciales puedan crear valor al proporcionar servicios especializados de manera más eficiente, ¿no deberíamos también considerar desde otra dimensión la «densidad de talento»? En esencia, cuanto más alto sea el nivel de descomposición en niveles atómicos de las capacidades de tus agentes y bots dentro de este sistema, mayor será la «densidad de talento», y en tareas complejas, los resultados, la eficiencia e incluso la innovación serán mejores. No sé si esta es una deducción correcta.
Liu Ye: Estoy de acuerdo con este punto de vista. Dentro de las empresas, existe un departamento que, en las grandes empresas, generalmente se llama OD, es decir, Desarrollo Organizacional. La forma habitual de medir si una organización puede ganar una batalla es comparar a todos los talentos del oponente, evaluando la correspondencia entre personas y puestos, así como la fortaleza de las habilidades respecto al puesto, para predecir el resultado del conflicto. Por lo tanto, en general, las empresas ganan gracias a su capacidad organizacional, no a su estrategia comercial. El ejemplo más típico es Alibaba. Alibaba otorga una gran importancia a la construcción organizacional, lo que le permite hoy en día experimentar un «segundo auge». Debido a que el equipo fundador envejece, pero la organización puede ser eternamente renovadora. En esencia, si algún día nosotros dos fuéramos competidores y ambos utilizáramos IA, yo habría construido una organización de IA poderosa con una fuerte capacidad de desarrollo organizacional de IA. ¿Cómo construiría esta organización? Abriría uno por uno los sistemas de habilidades de los agentes de mis competidores, analizaría sus códigos de habilidades, y luego desarrollaría en mi propio sistema habilidades superiores, e incluso completaría funciones que les faltan. Por ejemplo, si tengo un departamento de estrategia, primero realizaría observación y análisis.
Huawei tiene una metodología llamada "Cinco Observaciones y Tres Definiciones". Le digo a mis amigos bromeando que, si emprendiéramos un negocio usando solo esta metodología, podríamos eliminar al 99% de nuestros competidores. Las "cinco observaciones" consisten en observar las tendencias del sector, el mercado y los clientes, los competidores, nuestras propias capacidades y las oportunidades estratégicas; las "tres definiciones" son definir los puntos de control, los objetivos y las estrategias. Esta metodología es suficiente para filtrar a la mayoría de los competidores, porque la mayoría de las personas juegan al ajedrez al azar, confiando en el pensamiento rápido, mientras que los expertos activan por defecto el modo de pensamiento profundo y razonamiento. La primera reacción debe ser: debo pensar como comandante sobre cómo abordar este asunto.
Zhang Peng: Lo que se denomina "mirar cinco veces, decidir tres veces" es esencialmente evitar la "reacción de estrés" y establecer un proceso de razonamiento prolongado.
Liu Ye: Los expertos son modelos de investigación profunda y pensamiento, que primero analizan las mejores prácticas y la información globales, luego resumen, analizan y reflexionan profundamente antes de dar una respuesta, y al actuar, aplican un golpe decisivo.
Por lo tanto, creo que el núcleo de la competencia futura es solo una cosa: modelar los negocios de las industrias tradicionales, abstraerlos como capacidades sistémicas capaces de orquestar agentes inteligentes. Esta es la nueva capacidad de desarrollo organizacional (OD), que se elevará a AIOD, la única ventaja competitiva del futuro.
La ventaja fundamental de Alibaba radica en construir organizaciones; una vez que la construcción organizacional está bien establecida, la empresa puede competir eficazmente frente a cualquier competidor y en cualquier negocio. Además, Jack Ma una vez dijo que el propósito de una batalla no es necesariamente ocupar un determinado campo, sino lograr el crecimiento de la organización a través de la batalla. Alibaba utiliza el crecimiento organizacional como criterio central para decidir si una batalla merece la pena ser librada; se trata de un pensamiento de alto nivel. Jack Ma actúa como un supercentro de información, viajando 200 veces al año para recopilar diversos tipos de información, que luego utiliza para perfeccionar la construcción organizacional. Él es verdaderamente un presidente en el sentido más auténtico del término, no simplemente un director ejecutivo.
Esta es la forma más avanzada de organización que hemos visto: capaz de trascender varias generaciones, abarcar diferentes industrias, lograr éxitos continuos y recuperarse tras períodos de declive. Por lo general, una empresa que nombra incorrectamente a su director ejecutivo durante una década tiene altas probabilidades de caer en el declive. Por lo tanto, tomando como referencia la historia y observando el desarrollo actual desde una perspectiva de mayor nivel, incluso realizar ajustes y optimizaciones al modelo existente es mucho más eficiente que construir desde cero desde la base.
Ahora cualquiera puede construir fácilmente un agente, y la barrera de entrada para los empleados es extremadamente baja. Además, con el respaldo de la comunidad de código abierto, la industria ya no tiene muchos secretos. La competencia en el nivel de las herramientas nunca puede superar a la comunidad de código abierto. Entonces, ¿qué es lo que la comunidad de código abierto no posee y no puede replicar como ventaja competitiva fundamental?
04 La física de las organizaciones de IA: ¿Por qué la "exposición progresiva" es clave?
Zhang Peng: En la era pasada, al hablar de organizaciones, se enfatizaban una serie de elementos como la cultura organizacional, los valores, los KPI, etc. Al pasar de la gestión organizacional de la era pasada a la nueva era de las organizaciones de agentes de IA, ¿qué elementos se pueden descartar por completo y cuáles se pueden conservar pero necesitan transformarse?
Liu Ye: La razón principal por la que Anthropic lanzó skills es el concepto de "exposición progresiva" en el campo de la codificación con IA: si la IA recibe una gran cantidad de información desordenada, sufre corrupción del contexto y confusión debido a la falta de atención; solo la exposición progresiva permite que la IA mantenga una buena atención y genere resultados de alta calidad. Si se logra la exposición progresiva mediante intervención humana, en esencia se trata de una conversación completamente manual, lo que resulta ineficiente. Por lo tanto, el valor fundamental de skills consiste en descomponer tareas complejas en capas para lograr una exposición progresiva de la IA.
Esto es coherente con la lógica de gestión corporativa: la junta se enfoca en cuestiones estratégicas, el CEO en cuestiones tácticas y la gestión de ejecutivos, mientras que los empleados manejan tareas simples. Si 300 personas participan simultáneamente en la misma reunión, esa reunión no podría llevarse a cabo. El propósito fundamental de una organización es lograr un procesamiento jerárquico de la información, al igual que las tres formas normales de una base de datos mejoran la eficiencia mediante la compresión y jerarquización de la información. Los problemas complejos deben descomponerse en capas y exponerse progresivamente, en lugar de introducir una gran cantidad de contexto de una sola vez; esta es precisamente la lógica central de la estructura organizacional tradicional, ya que la capacidad de cómputo disponible en un momento dado es limitada.
Zhang Peng: Cada vez que el modelo debe consumir una enorme cantidad de poder de cómputo para crear desde cero, la eficiencia es demasiado baja.
Liu Ye: Es imposible lograrlo; el núcleo sigue dependiendo de una exposición progresiva por capas: los recursos que se deben llamar deben llamarse, lo cual está determinado por los límites de capacidad del modelo de IA. Además, otra razón por la que Anthropic lanzó skills es que las tareas complejas han superado los teoremas fundamentales de la física; los skills permiten descomponer tareas complejas en una serie de tareas simples y de baja dimensión. La dimensión clave para distinguir las tareas no es su dificultad, sino su complejidad: existen diferentes tipos, como dificultad de baja dimensión, dificultad de alta dimensión, etc. Por ejemplo, programar y resolver problemas matemáticos son tareas de baja dimensión pero de alta dificultad.
Hori Zhou propuso un modelo clásico: todos los trabajos pueden clasificarse en cuatro cuadrantes según el «nivel de competencia» y la «altura dimensional», es decir: alta dimensionalidad y alta competencia, baja dimensionalidad y baja competencia, baja dimensionalidad y alta competencia, y alta dimensionalidad y baja competencia. Ventas e ingenieros pertenecen a la categoría de baja dimensionalidad y alta competencia; los gerentes de producto y los CEO pertenecen a la categoría de alta dimensionalidad y alta competencia; los científicos, en cambio, pertenecen a la categoría de alta dimensionalidad y baja competencia: estos temas podrían ser estudiados por solo una persona en todo el mundo, con baja competencia pero una dimensionalidad extremadamente alta. Tareas de alta dimensionalidad y alta competencia, como series cortas de calidad o buenas novelas, aún no pueden ser realizadas por la IA; mientras que tareas de baja dimensionalidad y alta competencia, como la optimización de código, ya pueden ser desempeñadas muy bien por la IA. Cuanto más alta sea la dimensionalidad de una tarea, menor será la cantidad de fuentes de datos disponibles, pero mayor será la cantidad de datos necesaria para entrenar el modelo; esta es precisamente la razón fundamental por la que los modelos de texto aparecieron antes que los de imágenes y videos, y por la que los modelos de videos cortos resultan tan difíciles de implementar. Esta contradicción entre la oferta y la demanda de tareas de alta dimensionalidad y datos de alta dimensionalidad solo puede compensarse descomponiendo las tareas en habilidades específicas, al igual que cuando una empresa no encuentra talento para puestos senior, los divide en tres puestos básicos; solo los puestos de alta dimensionalidad, como el de CEO, son irremplazables.
Zhang Peng: Las tareas de baja dimensionalidad y alta competencia probablemente serán completamente reemplazadas por la IA.
Liu Ye: Será reemplazado al 100%, y este reemplazo ya ha ocurrido.
Zhang Peng: Es cierto, por lo tanto, todos los asuntos de baja dimensión y alta competencia deben resolverse lo antes posible con IA, lo que se puede descomponer en habilidades y luego implementarse mediante agentes, sin necesidad de intervención humana en este proceso.
Liu Ye: Tengo una idea preliminar: IBM y Accenture, como las dos mayores empresas de consultoría del mundo, tienen como negocio central la extracción de las mejores prácticas industriales y su alineación con la digitalización; lo que venden son procesos, no herramientas. Cuando las empresas adquieren procesos de riesgo o propiedad intelectual, siempre contratan a empresas de consultoría para su implementación. Nuestro trabajo central actual es construir clústeres de habilidades, identificar a los expertos líderes en cada campo, extraer sus capacidades y alinearlas para formar conjuntos de habilidades estandarizados. Esto es similar al modelo de Zuoyebang: Zuoyebang colabora con profesores del Colegio No. 4 de Pekín, la Escuela Secundaria Affiliated a la Universidad Renmin, el equipo de creación de exámenes de la Gaokao y de Xueersi para extraer métodos clave como la creación de preguntas, la explicación de problemas y la corrección, y luego trabaja con ingenieros de algoritmos de Baidu para construir un sistema; en esencia, también se trata de alinear las mejores prácticas. La capacidad organizacional clave consiste en formar equipos interdisciplinarios de alta calidad que comprendan tanto la industria como la ingeniería, puedan coordinarse con expertos líderes en diversos sectores y posean al mismo tiempo habilidades comerciales, de reclutamiento y gestión de talento; este es precisamente el componente central de las nuevas empresas de IA SaaS.
Zhang Peng: Al profundizar más, en el futuro se debe retroceder desde la dimensión del negocio para deducir la forma organizacional necesaria. La organización es esencialmente una estructura de coordinación, similar a un sistema operativo de negocio: al colocar a las personas como unidades de productividad en una organización adecuada, se maximiza su valor; de lo contrario, no puede funcionar eficientemente. Hoy en día, los factores de productividad han sido reemplazados: de depender de mano de obra humana a depender de IA, que puede suministrarse de forma ilimitada y que puede expandirse continuamente siempre que se forme un ciclo positivo. La cultura organizacional del pasado puede ahora transformarse en objetivos y contexto, ya no requiriendo eslóganes, reuniones de tres pasos clave ni actividades de rompimiento de hielo.
Liu Ye: La cultura es una intención de gestión, no una intención comercial. En la era pasada, la estrategia comenzaba con una visión; la visión determinaba el valor, la organización se subordinaba a la estrategia, los negocios validaban todo, y la cultura era simplemente un medio para gobernar la organización, sin servir directamente a la estrategia, e incluso podía ser simplemente una preferencia personal del fundador.
Zhang Peng: Durante el proceso de la estrategia de servicio humano, existían muchas brechas; ¿está AI eliminando estas brechas?
Liu Ye: Sí, la cultura ya no es importante en la era de la IA. La cultura es la parte de creencias de la organización humana, pero la IA no la necesita. La IA no tiene cuerpo físico, no requiere impulso cultural. La necesidad fundamental de la IA es el poder de cómputo.
Zhang Peng: Tu significas que la IA necesita objetivos y principios. Un solo documento es suficiente para definir claramente esos objetivos y principios, permitiendo que todas las unidades de productividad se sincronicen inmediatamente y los ejecuten fielmente, sin desviaciones. Gran parte de la fricción en las organizaciones humanas desaparece.
Liu Ye: Sí. La organización original: estrategia → cultura → talento → ejecución; la organización actual de IA: objetivo → principios → habilidades → orquestación. La cadena de gestión se ha reducido a la mitad.
05 La última barrera: estética y coreografía
Zhang Peng: ¿Cuál es la nueva barrera para las empresas? La calidad del talento se ha reemplazado por Skill Set; siempre que tenga buen gusto, puedo obtener las mejores habilidades del mundo. ¿Y luego, en el siguiente nivel, está la «orquestación» (Orchestration), correcto? ¿Qué cambios ocurrirán?
Liu Ye: Al igual que en Huaqiangbei puedes comprar todos los componentes electrónicos, ¿por qué no todos pueden fabricar un iPhone? La biografía de Jobs define con claridad el concepto de estética: haber visto suficientes cosas buenas en el mundo y poder distinguir entre lo bueno y lo malo es estética. Si nunca has visto productos buenos, procesos buenos u organizaciones buenas, no podrás lograr resultados de calidad.
Zhang Peng: La visión es el prerequisito del gusto.
Liu Ye: Solo experiencia y talento.
Zhang Peng: La estética se manifiesta de dos formas: una, el diseño y la organización activos; y dos, la identificación y selección de objetos de alta calidad que emergen en el caos. Ambas formas no son mutuamente excluyentes.
Liu Ye: Realmente no hay conflicto. Parte de los logros de Apple son desarrollos propios, y parte son adquisiciones de terceros; lo esencial es poseer un sentido estético: no es necesario reinventar la rueda, basta con desarrollar internamente cuando sea necesario.
Zhang Peng: La cuestión central es si se debe permitir que el agente ejecute su ruta dentro del módulo configurado y luego confirme el camino para lograr una orquestación emergente, o si se deben definir previamente todas las rutas para lograr una orquestación diseñada.
Liu Ye: La emergencia es no manipulable; se deben establecer primero reglas y principios semilla, lo que refleja el gusto de una persona. Al igual que un ingeniero excelente puede crear una Openclaw funcional con 500 o 5,000 líneas de código, mientras que un ingeniero incompetente no puede lograr el mismo resultado con 50,000 líneas, las reglas semilla subyacentes aún deben ser establecidas por humanos.
Zhang Peng: Entonces, no se puede esperar que surja el orden desde el caos, ya que eso requiere un tiempo extremadamente largo; la planificación sigue siendo fundamental. ¿Esta planificación solo puede provenir finalmente del fundador, o es más bien como un «productor»?
Liu Ye: Creo que esta definición de productor es excelente. Es cierto que, incluso con emergencia y efectos de escala, aún se requieren etiquetado de datos, limpieza de datos y alineación continua de algoritmos para evitar un crecimiento desordenado.
El número de personas required depende de la complejidad del negocio: una sola persona no puede completar tareas complejas, como producir cortos dramáticos o redactar prompts, ya que en la práctica se enfrentan a numerosas dificultades. El concepto de “empresa de una persona” se ha abusado; el mundo no puede simplificarse infinitamente. Aunque una computadora puede ser operada por una sola persona, es difícil para un individuo dominar todas las habilidades de alto nivel. Son extremadamente raros los talentos sobresalientes como Elon Musk o Fei-Fei Li, capaces de dominar múltiples campos y asumir cualquier puesto.
Zhang Peng: Si pudiéramos acceder al sistema de agentes y habilidades más avanzados del mundo, como un guionista excelente, ¿teóricamente podríamos utilizar estos recursos para producir una película de renombre mundial y rentable? Aunque el guionista tiene un punto clave (un buen guion), no puede completar todos los aspectos, ¿es viable este cierre de “punto clave + recursos globales”?
Liu Ye: Esto es esencialmente un problema de datos: ¿existen datos que almacenen información de alta dimensión? Por ejemplo, entrenar las habilidades de un CEO: actualmente no hay suficientes datos para respaldarlo; los extensos escritos de Ren Zhengfei o las declaraciones orales de Jack Ma no pueden capturar completamente su conocimiento de alta dimensión; incluso si se recopilaran todos los estados financieros de empresas globales y todas las declaraciones de CEOs, no se podría entrenar un modelo capaz de desempeñar el rol de un CEO, porque la capacidad central de un CEO es conocimiento tácito, que no puede revelarse completamente a través del texto.
Zhang Peng: Es decir, las habilidades clave del CEO aún no se pueden vectorizar. Esto limita la idea ideal de la "empresa de una sola persona": incluso si cada persona puede aprovechar sus ventajas en una sola dimensión y combinarlas con recursos de primer nivel mundial, aún falta el coordinador central, lo que en esencia sigue siendo un problema de capacidad de coordinación. En última instancia, poseer los mejores "componentes" aún requiere una poderosa capacidad de coordinación.
Liu Ye: Los product managers también tienen conocimientos implícitos que no pueden completamente textularse. Esta es la razón fundamental por la que los compañeros de IA y los contenidos generados por IA no son lo suficientemente «vivaces»: carecen de soporte de datos de conocimiento implícito de alta dimensión. Cuando hay pocos datos, se enfoca en las habilidades; cuando hay muchos datos, se desarrolla el modelo. Actualmente, los robots no pueden implementarse, y la causa principal es la falta de datos suficientes.
Zhang Peng: Se puede deducir que, en el futuro, el punto decisivo de la competencia entre empresas ya no será el acceso a modelos de vanguardia; los recursos iniciales de IA parecen homogéneos, y la capacidad de cómputo está relacionada con los recursos financieros y la capacidad de cerrar el ciclo de negocio. Finalmente, la diferencia seguirá radicando en el propio “productor”, es decir, en su capacidad de organización y en la innovación y significado de sus objetivos, dos aspectos que constituyen la ventaja competitiva fundamental de la empresa.
Liu Ye: Un exsocio de McKinsey me dijo que el negocio principal de McKinsey consiste en extraer las mejores prácticas, crear modelos y ayudar a las empresas a implementarlas paso a paso. Por ejemplo, al asesorar a fabricantes de automóviles en China, se consultaba a colegas japoneses sobre las prácticas de Toyota; en esencia, se trataba de copiar y aplicar las mejores prácticas.
El caso de Mi Meng con las series cortas es muy relevante. Es graduada en filología china, pero su equipo principal está compuesto por profesionales de las universidades Tsinghua y Pekín con formación en matemáticas e informática, dedicados específicamente a descomponer la lógica detrás de los videos virales, logrando finalmente una tasa de éxitos extremadamente alta. Este enfoque es esencialmente una modelización de la ingeniería social en la industria; aunque existe la posibilidad de sobreajuste, la dirección del modelo es correcta.
IBM, Accenture y McKinsey hacen este tipo de cosas: McKinsey de primera generación modeló las mejores prácticas en los socios, mientras que IBM las convirtió en procesos digitales; en esencia, ambas venden gestión y procesos.
Zhang Peng: Lo esencial es identificar las mejores prácticas y verificarlas repetidamente en la implementación; esta es la clave del éxito en las organizaciones comerciales del futuro. Solo al desglosar adecuadamente se puede lograr una coordinación eficiente. Entonces, ¿su dirección principal a continuación es avanzar siguiendo este enfoque?
Liu Ye: Durante los últimos tres años, nos hemos enfocado principalmente en negocios de IA para el consumidor, reconstruyendo todo el sistema de enseñanza e investigación mediante el enfoque de MetaOrg. Esto no es simplemente una historia de «usar IA para aumentar la eficiencia». Hemos construido una organización de investigación educativa completamente agente, con equipos virtuales de investigación funcionando en su interior: un equipo de investigación en aprendizaje de idiomas que rastrea las teorías más recientes en adquisición de segundas lenguas; un equipo de recolección de corpus vertical que captura expresiones auténticas desde contextos reales; un equipo de evaluación de conversaciones que establece estándares multidimensionales para evaluar la competencia oral; un equipo de diseño de conversaciones que convierte la pedagogía en interacciones naturales entre humano y máquina; un equipo de diseño de contenedores de ejercicios que resuelve problemas de adaptación entre formato y contenido de práctica; y un equipo de análisis de datos que extrae señales reales de efectividad del aprendizaje a partir del comportamiento del usuario. Cada equipo tiene sus propias habilidades, flujos de trabajo y criterios de evaluación. Actualmente, aproximadamente el 80% de las tareas, como etiquetado de datos de materiales didácticos, monitoreo y evaluación, comprensión del usuario e iteración del producto, son realizadas por IA.
Nuestro camino de desarrollo pasa de «IA como función» a «IA como capacidad organizacional». El puesto de profesor de inglés tiene una complejidad media; ya lo hemos abstraído y generado otros puestos mediante MetaOrg; si se combina con la arquitectura de habilidades más reciente, se podrá construir puestos aún más avanzados.
Actualmente hemos completado la implementación integral del tutor de IA, incluyendo la abstracción y la realización técnica de las capacidades de orquestación. En el futuro, es muy probable que el Meta tutor se evolucione hacia una organización Meta, cuya unidad mínima es el puesto, no el empleado, y cuyo núcleo radica en la colaboración y gestión entre puestos. Nuestro enfoque actual es conectar con los CEO más destacados de cada industria, ya que ellos son los verdaderos «productores» clave.
Zhang Peng: Entonces, lo que han lanzado es más bien un departamento escalable?
Liu Ye: El objetivo es avanzar hacia la dirección de una "empresa". Una gran empresa, en esencia, está compuesta por múltiples pequeñas empresas, y la unidad más pequeña es el puesto. Es necesario prestar atención a la selección estratégica de toda la industria, pero también comenzar desde el puesto para impulsar la iteración del producto: si los puestos no se desempeñan bien, incluso un gerente con grandes habilidades no podrá formar una organización eficiente.
Zhang Peng: Para gestionar bien un departamento, primero se deben desglosar las capacidades y puestos relacionados con el departamento, luego desglosar las habilidades correspondientes a cada puesto, y se debe perseguir que estas habilidades alcancen el nivel SOTA.
Liu Ye: Solo hay un método fundamental: co-crear con las empresas más destacadas que se sirven. Las habilidades desarrolladas deben ser evaluadas por empresas de primer nivel para determinar si cumplen con las necesidades, al igual que un plan redactado por un subordinado requiere la aprobación de su superior; no se trata de auto-satisfacción. Por ejemplo, al crear modelos para series cortas, se requiere el reconocimiento de instituciones líderes en la industria; de lo contrario, no se considera verdaderamente de primer nivel. Todo debe ser evaluado y medido.
Midjourney puede generar imágenes de alta calidad porque su equipo está compuesto por fotógrafos e ingenieros con un excelente sentido estético visual; LV entrenó su modelo de imágenes con Stable Diffusion, logrando resultados mucho superiores a los modelos comunes, ya que LV posee el mejor sentido estético visual y los datos más avanzados del mundo. Esto demuestra que la capacidad de evaluación es lo esencial. Para ser una empresa de IA, se debe actuar como IBM o Huawei: después de servir a los principales fabricantes de automóviles, IBM adquirió las mejores prácticas de fabricación y las externalizó; Huawei invirtió 4 mil millones en adquirir el proceso IPD, utilizándolo tanto para su propia gestión como para externalizarlo: esta es la verdadera ventaja competitiva.
Zhang Peng: En esencia, se trata de descomponer las habilidades según las mejores prácticas, lograr el SOTA para cada habilidad, luego elevarlo al SOTA del puesto y del departamento, y finalmente organizarlo como el SOTA del negocio; esta es la ruta clara hacia la excelencia en el negocio. Hay otra pregunta clave: ¿cómo mantener las habilidades actualizadas? Al igual que la variación en el ecosistema terrestre, el SOTA de cada época puede quedar obsoleto en la siguiente; ¿cómo enfrentar este cambio?
Liu Ye: La lógica central es coherente con la evolución humana y biológica: percepción, planificación, acción y reflexión. Mantener una alta densidad de talento y la naturaleza interdisciplinaria de la organización, conectando un extremo con la vanguardia tecnológica (investigadores) y el otro con el estudio de modelos de negocio, mientras se colabora simultáneamente con clientes líderes de la industria para evaluar y optimizar continuamente en escenarios reales; este es el único método.
Zhang Peng: Al invertir este razonamiento, los sistemas formados por las mejores prácticas de las empresas de élite pueden ayudar a las empresas de nivel medio a lograr un avance significativo, pero es probable que solo las empresas con recursos y capacidad financiera puedan acceder a estos sistemas, lo que hace que las pequeñas y medianas empresas y los emprendedores jóvenes no puedan permitírselos. La industria de consultoría ya ha evolucionado de servicios tradicionales a productos estandarizados. ¿Las oportunidades para la nueva generación solo existen en el nivel de habilidades? ¿Cómo lograr una innovación disruptiva en el nivel de habilidades para evitar que la industria caiga en un «círculo de élite»?
Liu Ye: En la generación anterior de la industria SaaS, empresas como Salesforce, Palantir, Notion y Slack, algunas enfocadas en herramientas generales y otras en servicios integrados, demuestran que los jóvenes emprendedores aún tienen oportunidades: alejarse de actividades en las que no se tiene ventaja competitiva, centrarse en habilidades generales y encontrar un nicho ecológico adecuado. Notion es un ejemplo típico: no implica procesos de negocio específicos, sino que abstracta la función de toma de notas textuales, convirtiéndose en una herramienta general. El mundo finalmente será una colaboración entre innumerables agentes; los jóvenes deben primero identificar su nicho ecológico y luego aprovechar sus fortalezas personales, anclándose en las tendencias futuras y evitando convertirse en enemigos del tiempo. En la última década, los primeros emprendedores de internet fueron principalmente expatriados (con ventaja cognitiva), los segundos fueron principalmente programadores (con el auge de las herramientas), y los terceros de la industria internet fueron principalmente emprendedores de segunda generación; la tendencia es clara: los jóvenes deben comprender el juego intermedio y sus propias fortalezas.
Zhang Peng: Entonces, crees que la innovación y optimización locales en el nivel de habilidades tienen un impacto limitado; la mayor oportunidad para la nueva generación podría radicar en la innovación de objetivos: identificar los nuevos objetivos que surgen en la era, combinarlos con habilidades de alta calidad y evolucionar continuamente para construir nuevos sistemas sobre estos objetivos y lograr una ruptura.
Liu Ye: La competencia en habilidades es muy sutil; aunque las habilidades actuales son populares, si alguien logra alinearse con expertos humanos aún más destacados y crea habilidades superiores, las habilidades actuales serán reemplazadas. Esto vuelve al problema del foso de protección: los primeros en llegar no necesariamente serán los últimos en triunfar, y podrían convertirse en "nutrientes del suelo" para oponentes de un nivel superior.
Zhang Peng: Lo que teme es convertirse en un «cargador», solo ayudando a un oponente de dimensiones superiores a establecer las bases. Si solo se optimiza la eficiencia sobre los objetivos existentes, no tiene sentido, ya que la ventaja de eficiencia eventualmente se eliminará. Por lo tanto, para lograr una ruptura, la nueva generación debe establecer diferencias fundamentales en los objetivos.
Liu Ye: Correct, if you cannot grow into a core force, you merely nourish a higher-dimensional opponent. The essence of business is simple: clearly identify who your customers are, how to serve them, and how to make them unable to do without you. Any young person who cannot clearly define their customers cannot achieve optimization.
Zhang Peng: También debes prestar atención al mercado incremental; la competencia en el mercado existente es extremadamente difícil. Si tu negocio tiene éxito, elevará a las empresas del sector correspondiente al mismo nivel avanzado; estas empresas cuentan con riqueza y conocimiento, y es difícil para los jóvenes competir con ellas en el mercado existente.
Liu Ye: En la generación anterior de la industria SaaS, el éxito de empresas como Notion y Slack se basó principalmente en la diferenciación de objetivos.
En las primeras etapas del desarrollo de SaaS de la generación anterior, los fondos chinos tendían a invertir en científicos, pero luego descubrieron que los científicos son más adecuados para la colaboración y el intercambio de ideas, no para emprender: los campos de alta dimensión y baja competencia en los que se encuentran los científicos difieren de la lógica de alta dimensión y alta competencia del mundo empresarial; cuanto mayor es la dimensión del campo, mayor es la dificultad para cambiar a un nuevo campo, ya que los patrones de pensamiento fundamentales son completamente distintos. En las etapas iniciales de cualquier campo, la competencia es tecnológica (baja dimensión, alta competencia, tecnología inmadura); una vez que la tecnología madura, la competencia pasa a ser comercial (alta dimensión, alta competencia, dominada por profesionales de la industria, product managers y practicantes de negocios). Por ejemplo, cuando se lanzó el iPhone original, las aplicaciones en las listas de popularidad eran principalmente desarrolladas por programadores; unos años después, con el auge de la industria de Internet, todos los productos liderados por programadores en las listas fueron reemplazados.
Si la era de la IA sigue la lógica de Internet móvil, el núcleo de poder de Silicon Valley seguirá siendo los profesionales con experiencia, al igual que en Internet industrial en China, donde muchos son emprendedores de segunda generación. La oportunidad para los jóvenes sigue radicando en encontrar objetivos diferenciados.
