Opus 4.8 no era lo que esperaba
386 segments
más noticias, mejores noticias o no tan
buenas noticias, no lo sé, cómo lo
quieren ver, porque ha salido Opus 4.8,
la gente de Anthropic el 28 de mayo
anunció Cloud Opus 4.8 su modelo público
más potente, porque ya sabéis que tiene
a Mizos, pero todavía no está disponible
para el público. Ahora mismo Opus sigue
siendo el modelo público más potente que
tiene la gente de Anthropic. Así que
pasan de Cloud Opus 4.7 y llegan al Opus
4.8. Dicen que está construido por
encima de Opus 4.7 con mejoras en todos
los benchmarks. Ahora lo veremos, que es
un colaborador más efectivo y que está
disponible hoy mismo por el 28 de mayo,
hoy estamos a 1 de junio por el mismo
precio. Además, Opus 4.8 viene con
nuevas funcionalidades. Ahora en
cloud.aiai, AI en la página web,
básicamente podéis controlar cuánto
esfuerzo va a poner Cloud en cada tarea.
Y además Cloud Code tiene una nueva
funcionalidad que se llama Dynamic
Worflows, que luego hablaremos de esta
porque ha venido con polémica también,
eh, ha venido con polémica y un nuevo
modo fast mode, ¿vale? modo rápido por
si no tienes paciencia, pero sí que
tienes dinero, que puede hacer que
trabaje el modelo en 2,5x, pero que dice
que es más caro, pero es tres veces más
barato que en los modelos anteriores. O
sea, el modo rápido es más caro que el
normal, pero es tres veces más más
barato de lo que lo era anteriormente.
Es que antes era absurdamente caro, era
un 25x, una salvajada lo caro que era.
Bueno, pues aquí tengo las capacidades
de Opus 4.8. Si os gusta y sois muy
frikis, que sepáis que tenéis al System
Car, que esto es un PDF de cuántas lí
cuántas páginas,
240 páginas. Vale, por si queréis leeros
pues todas las cosas, cómo lo han estado
revisando todos los benchmarks, pues si
queréis saber pues casos de uso, cómo lo
han comparado, bla bla bla. Aquí hay un
montón de datos, datos, datos, datos.
Está está super bien, pero bueno,
nosotros ya lo queremos digerido. Y aquí
tenemos las capacidades de Opus 4.8
comparados con el resto. Y ojo porque
hay novedad. Anthropic entra a la
batalla. Esto es una cosa que antes yo
no recuerdo o que o que pasara o que no
pasaba mucho. Yo no recuerdo que antes
fuese así. Por ejemplo, en Cloud Opus
4.7 cuando Ah, sí, no, sí que lo tenemos
por aquí. Ah, ah, ah, sí que lo tenemos.
Nada, nada. Pues nada, mira, ponía aquí
Mizos preview. Nada, nada. No recordaba,
no recordaba que lo comparaba con la
competencia. Yo pensaba que lo
comparaban siempre con los suyos
anteriores, pero no, no. Totalmente,
totalmente lo comparan. Bueno, pues
amigos, fijaos, Opus 4.8 lo compara con
Opus 4.7, es mejor en todo, o sea, mejor
en todos los benchmarks, que ya sabéis
que yo de benchmarks ya no es que no no
sé, a mí los benchmars no me dicen mucha
cosa. De hecho, ahora daré mi opinión de
Opus 4.8, no os preocupéis. GPT 5.5
sigue siendo mejor enentic terminal
coding, ¿vale? con un 4% mayor, todo el
resto está peor y Gemini 3.1 Pro que se
está quedando pues a la zaga, se está
quedando por detrás del resto en
general, bastante por detrás en algunos,
fíjate en agentic muy muy por detrás, o
sea, ya puedes espabilar Google a ver si
lo sacan lo sacan a finales de este mes,
se supone. Entonces, bueno, pues aquí
tenemos Opus 4.8, mejora en todo, pero
¿dónde se ve que realmente tenemos la
mejora? En la honestidad. Por fin
tenemos un modelo inteligencia
artificial que dice ser honesto, aunque
dicen que entrenan todos sus modelos
para que sean honestos. En este caso
dice que Opus 4.8 es más honesto en el
sentido de que si no es capaz de saber
algo, si se da cuenta que no sabe
solucionar algo o lo que sea, pues es
como que te lo va a decir. ¿Sabes que
dice que un problema general de la
inteligencia artificial es que muchas
veces pues salta conclusiones que con
confianza te dice, "Sí, sí, he hecho
progreso, he hecho esto y tal, no sé
cuánto." Y luego pues te lo tienes que
creer. Pues di, "Sí, sí, lo he
arreglado." Pero según ellos, Opus 4.8
och es la primera vez que es cuatro
veces cuatro veces más posible que sea
honesto y que te diga, "Oye, no sé
hacerlo, no lo he solucionado, no sé
cómo tendría que abordar esto." ¿Vale?
Entonces, mira, aquí tenemos, por
ejemplo, el comportamiento que está
desalineado, está al nivel de Mizos
preview y cómo ha bajado con una
puntuación de 1 al 10. Fijaos que antes
estaba en el 2,5 aproximadamente,
después ha bajado al 1,8. Claro, cuanto
menos mejor. ¿Qué más han lanzado este
día de hoy? Eh, la gente de Out 4.8, los
Dynamic Workflows, bueno, Dynamic
Workflows, que esto está en Cloud Code
for Enterprise, en Team y en los planes
Max. Lo digo porque si no lo ves es
porque estás utilizando la suscripción
de pobre, ¿vale? La que utilizo yo, la
suscripción de pobre. Entonces, por eso
seguramente no te no te va a funcionar.
Y es que aquí tenemos los dynamic
workflows en Cloud Code y esto ha sido
bastante polémico. Los workflows, que es
interesante la idea, esto lo que te
ayuda es a crear pues esas tareas que
sean muy complicadas para que las puedas
hacer de punta a punta, o sea,
terminarla del todo. Y esto lo que hace
es que Cloud dinámicamente genera unos
scripts para ejecutar cientos de
subagentes en paralelo. Cientos, eh, no
uno, dos, no, cientos en una sola
sesión. Y claro, por ejemplo, imagínate
que quieres hacer una migración de
Riaaca Solid, pues esto lo que hace es
como partirse el trabajo en un montón de
agentes, hacer un montón de fases, se
vuelve como loco, como loco. Y claro,
ahí podéis ver toda la de tokens que vas
quemando, todos los agentes. Mirad aquí,
35 agentes. Obviamente esto no está
pensado para cualquier tarea. Pero,
¿cuál ha sido la polémica? Pues la
polémica es que este modo se activaba
cuando tú simplemente escribías la
palabra workflow. O sea, tú escribías la
palabra workflow y ya se activaba. Dice,
"Así que cada vez que digo la palabra
workflow en Cloud Code, digamos cuando
estoy creando un nuevo Workflow de
GitHub. Intenta entrar en modo workflow
activando docenas de subagentes para
completar mi tarea. cosa
estúpida." Dice, "Esto es una elección
de diseño bastante extraña. ¿Quién pensó
que esto era buena idea?" Es que es
verdad. O sea, tú le podías poner un
prom y automáticamente si detectaba la
palabra workflow decía, "Ah, ya está
activado, venga, para adelante." Ya lo
han arreglado. O sea, ya arreglado de
que se puede desactivar. Eh, ves, hay
gente que se estaba quejando, pero es
que fijaos que dice dentro del workflow
y encima te lo pone como en narcoiris y
dice, "Ah, sí, Wflow, venga a quemar
tokens." Pam, venga, toma 100.000 tokens
quemados. O sea, brutal, ¿eh? Dice,
"Quiero hacer esto. Me gustaría crear no
sé qué sé cuánto. Invocado dentro
delflow." Vale, y ya está. He dicho
workflow. Hala, pues venga, a quemarte,
a quemarte. Ya dice, "Aprecio el
comentario." Por ahora puedes
desactivarlo por prom. ¿Ves? Lo tienes
que desactivar así. Tienes que ir a
config y lo tienes que desactivar. Lo
tienes que desactivar tú a mano, si no
estás Eh, eh, no sé, yo creo que
este tipo de cosas en todo caso tendría
que estar desactivado por defecto. No,
no sé. Estas ideas yo sé que bueno, las
tienen ellos, obviamente para que así te
gasten los tokens, pero ¿cómo vas a
poner una palabra tan evidente en el
mundo de la promoción como es Wflow para
activar un modo que te puede quemar la
casa entera? O sea, es una cosa salvaje.
Qué bueno que se pueda desactivar,
¿vale? Pero no sé, creo que hubiera sido
buena idea que estuviera desactivado por
defecto y que se tuviera que activar con
un comando como se ha tenido que hacer
hasta ahora. No sé, por si no lo sabéis,
la reescritura de B resulta que lo
hicieron con estos dynamic workflows.
Dice que toda reescritura de B, Jarred
Summer utilizó las dynamic workflows
para pasar B de thick a RAS, que ya
sabemos cómo lo hizo tan rápido. Lo hizo
así y teniendo tokens infinitos, como os
podéis imaginar. Bueno, esto es Opus
4.8. Entre todas las cosas y
disponibilidad y tal, lo más
interesante, yo creo, aparte de las
mejoras, es que el precio sigue siendo
el mismo. No ha cambiado el precio
respecto a Opus 4.7. Buena noticia,
porque normalmente estaba subiendo los
precios de las APIs cada vez que salía
un nuevo modelo. En este caso parece ser
que no. Sigue siendo lo mismo. $ por
cada millón de tokens de input, $25 por
cada output por millón de tokens. Y el
fast mode pasa a ser simplemente el
doble, o sea, un 2X que está bastante
bien de precio. O sea, ahora si activas
el modo rápido tienes que son $10 por
millón de tokens en input y $50 por
millón de tokens el output. Bueno, pues
ahí ahí lo tenéis, Opus 4.8. Ahora, la
pregunta del millón, eh, ¿vale? Bueno,
lo primero que os tengo que comentar, si
lo mira, lo voy a poner por aquí, hecho
una pequeña aplicación que tenía ganas
de hacer y que sepáis que lo he tenido
que hacer la mitad con Visual Studio
Code y la otra mitad con cursor. ¿Por
qué? Porque no me daba con Visual Studio
Code no me daba. Y para que veáis que
tampoco con Visual Studio Code hecho
tanto trabajo, creo que tengo por aquí
un poco eh lo que es el chat, ¿vale?
Entonces, veis ahí más o menos cada
conversación han sido dos o tres proms,
¿vale? para os hagáis un poco la idea.
Entonces, fijaos que empecé hace 8 horas
y aquí 5 horas. Pues claro, ya veis ahí
un poco el uso que os decía que pues que
ha sido una pasada, ¿no? Que todo lo que
lo que ha estado utilizando de de
créditos y todo esto. Entonces est
utilizando Opus 4.8 y fijaos que aquí ya
ni siquiera ni siquiera te pone el 2x y
ya no te dice nada, ya solo te dice
coste alto, te va a costar la vida. Ya
en Visual Studio Code ahora no te dice
si es 1x, 2X, 50X, simplemente te dice
coste por 1,00ón y te dice entrada 500
créditos. Entré 50 créditos, resultado
2,500 créditos. Eso es todo lo que te
dice. Punto. Ya está. ¿Sabes? No te dice
te habla por créditos, pero es que por
créditos es como muy difícil de
entender. Y fijaos que GPT 5.5 y Opus
pues tienen más o menos el mismo precio,
que a mí me sorprende. De hecho, GPT 5.5
es más caro, es más caro que Opus 4.8.
Me sorprende que Microsoft, siendo un
accionista de Open AI, no hayan podido
conseguir mejor precio. No sé. yeminite
3.5 flash. Fijaos que es más barato,
pero que también es bastante caro, ¿eh?
Va por créditos. Es así, créditos,
créditos. Bueno, total que he estado
utilizando Opus 4.8 y os vengo a dar un
poco mis opiniones. Tengo que deciros
una cosa que a ver si os encuentro la
conversación, porque he tenido una
conversación que me ha costado la vida
que me entendiese. Mira que le he
hablado bien, eh, está quedando muy
bien, o sea, le hablo bien y tal. Oye,
tengo que decir que primero yo no he
detectado ninguna mejora sustancial con
Opus 4.7. cero, o sea, he detectado
cero. Y, de hecho me ha sorprendido que
en ciertas cosas me ha funcionado peor.
Yo ya no sé si soy yo, si es la
inteligencia artificial, pero me da la
sensación que si me hubieran dicho que
era Opus 4.5 me lo hubiera creado, que
ahora alguien me me vendrá y me dirá,
"No, pero yo digo que con este proyecto,
que un proyecto que al final ha quedado
bastante bonito, también voy a decir
otra cosa polémica. Me sabe mal, eh,
pero voy a decir una cosa polémica. Creo
que Cursor está a otro nivel ahora mismo
respecto a Visual Studio Code. Ya no es
el problema de la suscripción, es el
problema de que a nivel de experiencia
de desarrollo, a nivel de cómo funcionan
los modelos y tal, en Visual Studio
Code, de vez en cuando me estaba
machacando los cambios yo, madre mía,
qué desastre, qué desastre, tío. Nada,
nada, mucho mejor Cursor, ¿eh? Cuando he
trabajado con Cursor, mucho mejor, tío,
mucho, mucho mejor. En fin, que
igualmente, igualmente, bueno, he hecho
este proyecto, ¿vale? Este proyectillo
es una tontería, pero es para ponerle
subtítulos a cualquier vídeo utilizando
inteligencia artificial. Entonces, eh
esto es inteligencia artificial en local
porque yo le pongo muchas muchos
subtítulos a muchos vídeos y yo no tenía
ganas de pagar a nadie. Entonces esto lo
que hace es que tú puedes eh configurar
los subtítulos, lo detecta
automáticamente, el audio de entrada y
el de salida. Esto es totalmente de
código abierto, por cierto, que no lo he
subido el repo todavía, creo, pero lo
subiré. Entonces, genera los subtítulos.
Esto funciona en mi máquina, en local
utilizando web GPU, utilizando Whisper,
utilizando modelos en local. Y ahora si
todo va bien y no me peta el stream
porque estoy utilizando inteligencia
artificial y tal, bueno, pues debería
hacer la transcripción y vais a ver que
además he hecho un editor para que
podáis, ¿ves? Un editor donde puedes
cambiar eh pues el estilo de los
subtítulos. Los subtítulos los puedes
customizar más todavía, los puedes hacer
más grandes, los puedes eh hacer que
estén negrita, que tengan un background,
los puedes poner arriba, en medio,
abajo. Total, esto es una herramienta
que me he hecho un poco para mí, eh, que
además pues aquí tienes pues eh para ver
el editor de vídeo y tal y puedes pues
cambiar aquí lo que sea, ¿no? Aquí pues
le puedes decir, esto es un subtítulo.
Jajaja. Ahí puedes cambiar subtítulo y
lo que puedes hacer es descargarte el
vídeo con los subtítulos y ya está. Así
que nada, la verdad es que al final lo
he conseguido hacer. tenía la idea
bastante clara. He tenido que hacer
algunos cambios a mano, sobre todo el
tema de Wake Workers, Opus 4.8, pues no
era capaz, no era capaz de sacarlo y no
funcionaba y no había manera, tío. Pero
bueno, creo que ha quedado bastante
bien. Además, le he puesto para
deshacer, ¿vale? Si por ejemplo quieres
rehacer o puedo hacer control Z y
deshace los cambios. Puedes hacer esto
más pequeño por si quieres que los
subtítulos pues a veces salgan, a veces
no salgan. Los puedes eliminar también,
se puede hacer cositas, se pueden hacer.
Esto lo he hecho con Opus 4.8. Opus 4.8
está muy bien, o sea, no digo que sea
mal modelo, pero realmente tampoco me
parece un salto cualitativo y de hecho
me ha costado, me ha costado que a veces
me entienda, tío. Eh, no he tenido esta
sensación, por ejemplo, con GPT 5.5 o
con Opus 4.8. O sea, que no sé, tío. Me
ha sorprendido que le le estaba costando
entenderme. Era como que, ¿qué le pasa?
¿Qué te pasa, tío? Reacciona. ¿Que te
estoy hablando en chino o qué? No sé, no
me entiendes. O sea, era un poco tener
que preguntarle. Entonces, ya no sé si
ha sido Visual Studio Code o si es el
modelo, ¿sabes? Tampoco puedo
diferenciar, pero funciona bastante
bien. Así que le vamos a dar una
aprobada al Opus 4.8. Además, han
mantenido precios muy bien, las cosas
como son. Perfecto. Así que nada, ahí os
lo subiré, os subiré el proyecto. Ya
tengo la el dominio y todo, así que muy
pronto os lo dejo por aquí.
Ask follow-up questions or revisit key timestamps.
El video analiza el reciente lanzamiento de Claude Opus 4.8 por parte de Anthropic. Se destacan sus mejoras en benchmarks, una mayor capacidad de honestidad del modelo al admitir cuando no sabe algo, y la introducción de 'Dynamic Workflows' en Claude Code, una funcionalidad potente pero polémica debido a su activación automática. El creador comparte su experiencia práctica usando el modelo para desarrollar una herramienta de subtitulado local, expresando sentimientos encontrados sobre si realmente supone un salto cualitativo respecto a la versión anterior y comparando la experiencia de desarrollo entre Visual Studio Code y Cursor.
Videos recently processed by our community