ÖZET
Yapay zeka ajanları kod yazabilir, API'leri çağırabilir ve çok adımlı iş akışları çalıştırabilir. Şimdiye kadar tek bir yetenek onlardan kaçıyordu: video düzenleme. After Effects ve DaVinci Resolve gibi profesyonel araçlar, yapay zeka modellerinin eğitilmediği katmanlı zaman çizelgeleri ve JSON sahne grafikleri kullanır. HeyGen'in yeni açık kaynak projesi HyperFrames, bu yaklaşımı tersine çeviriyor. Yapay zeka ajanlarının HTML, CSS ve JavaScript kullanarak video oluşturmasına izin veriyor, ardından sonucu MP4, MOV veya WebM olarak işliyor. Tek bir komutla Claude Code yeteneği olarak kurarsınız ve ajanınız bir video düzenleyiciye dönüşür.
Giriş
Video, web üzerindeki en ilgi çekici iletişim formatıdır. Bir yapay zeka ajanının üretebileceği diğer her ortamın (metin, kod, görseller, grafikler) net bir araç zinciri vardır. Videonun yoktu.
Sora, Veo veya Runway ile bir modelden tam bir klip oluşturmasını isteyebilirsiniz, ancak bu yaklaşımın sınırları var. Tek bir istemden tek, monolitik bir video elde edersiniz. Onu düzenleyemezsiniz. Hareketli grafikler üzerinde veya belirli marka animasyonları ekleyerek tekrarlı çalışamazsınız. Ajana "3. sahneyi daha yavaş bir geçişle tekrar yap" diyemezsiniz.
HeyGen, bu boşluğu kapatmak için HyperFrames'i 17 Nisan 2026'da yayınladı. Ajanlara geleneksel video yazılımı öğretmek yerine, zaten bildikleri bir formatı verdi: HTML. Bu kılavuz, nasıl çalıştığını, yaklaşımın neden mantıklı olduğunu ve kendi ajanınızın video düzenlemesi için nasıl kuracağınızı anlatıyor.
Video üreten API odaklı ajan iş akışları geliştiriyorsanız, orkestrasyon katmanını da test etmek isteyeceksiniz. Apidog'un sonunda nasıl uyduğunu ele alacağız.
button
Yapay zeka ajanları daha önce neden video düzenleyemiyordu
Geleneksel video düzenleme araçları ajanlar için değil, zaman çizelgelerine tıklayan insanlar için yapılmıştı.
Üç özel engel:
Zaman çizelgesi tabanlı kullanıcı arayüzleri koda eşleşmez. After Effects, Premiere ve DaVinci Resolve projeleri özel ikili formatlar veya derinlemesine iç içe geçmiş JSON sahne grafikleri olarak saklar. Bir ajan bu dosyaları okuyabilse bile, anlamsal alan dardır. Bu formatlardaki model ağırlıkları için neredeyse hiç eğitim verisi mevcut değildir.
Hareketli grafikler görsel düşünme gerektirir. Animasyonları anahtar karelemek, eğrileri yumuşatmak ve katmanları birleştirmek genellikle gözle yapılır. Ajanlar bir önizleme penceresi görmezler. Hareket hakkında akıl yürütmek için metin öncelikli bir soyutlamaya ihtiyaç duyarlar.
Araçlar bir insan operatör varsayar. Oluşturma işlem hatları, eklenti ekosistemleri ve kodek seçenekleri hepsi kullanıcı arayüzü menülerinin arkasında yer alır. Bunları komut dosyaları aracılığıyla otomatikleştirmek sınırlı durumlar için çalışır (örneğin After Effects'teki ExtendScript), ancak API'ler dar ve kırılgandır.
Sonuç: ajanlar ffmpeg'i çağırmak, klipleri birleştirmek ve temel filtrelerle metin katmanı oluşturmak için bir komut dosyası yazabilirlerdi. Bunun ötesindeki her şey bir insan gerektiriyordu.
Video için HTML içgörüsü
HeyGen'in ekibi farklı bir gözlemde bulundu. Büyük Dil Modelleri (LLM'ler) milyarlarca HTML, CSS ve JavaScript sayfası üzerinde eğitildi. Yüz binlerce GSAP animasyonu, SVG kompozisyonu, Canvas deneyi ve Lottie dosyası gördüler. Web, eğitim verilerindeki en büyük yaratıcı ortamdır.

Sınır bir modelden görsel olarak zengin bir animasyon üretmesini istediğinizde, HTML'i akıcı bir şekilde yazar. Şunları nasıl yapacağını bilir:
- CSS ile öğeleri konumlandırma
- GSAP veya CSS anahtar kareleri ile animasyon yapma
- SVG yollarını oluşturma
z-indexveopacityile katmanlı sahneler oluşturma- Durumlar arasında geçiş yapma (tweening)
Bir düzenleyicinin ihtiyaç duyduğu tüm görsel temel öğeler zaten tarayıcıda mevcuttur. Eksik parça, bir HTML sahne zaman çizelgesini işlenmiş bir video dosyasına dönüştürmekti.
İşte HyperFrames'in yaptığı da tam olarak budur. Adı da bunu söylüyor: HTML, video Kareleri (Frames) haline gelir. HyperFrames.
HyperFrames nasıl çalışır
HyperFrames, standart HTML'e küçük bir data- özellik kümesi ekler. Bu özellikler video zaman çizelgesini tanımlar. Geri kalan her şey düz web kodudur.
Çekirdek özellikler:
| Özellik | Amaç |
|---|---|
data-composition-id |
Video kompozisyonu için benzersiz kimlik |
data-width / data-height |
Piksel cinsinden çıktı çözünürlüğü |
data-start |
Sahne başlangıç zamanı (saniye cinsinden) |
data-duration |
Sahne süresi (saniye cinsinden) |
data-track-index |
Çakışan sahneler için katmanlama sırası |
Ajan normal bir HTML dosyası yazar. HyperFrames veri özelliklerini okur, sayfayı başsız bir tarayıcıda çalıştırır, hedef kare hızında kareleri yakalar ve çıktıyı FFmpeg ile kodlar.
İşte bu kadar. Yeni bir DSL yok. Sahne grafiği yok. Anahtar kare düzenleyici yok. Animasyon, modelin zaten ürettiği kod olan GSAP zaman çizelgelerinde veya CSS animasyonlarında yaşar.
Minimal bir örnek
İşte 70 satırdan daha az HTML ile 5 saniyelik bir video kompozisyonu. İki sahne: yavaşça belirip kaybolan bir başlık kartı, ardından kapanış ekranına bulanık bir çapraz geçişle geçiş.
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<script src="https://cdn.jsdelivr.net/npm/gsap@3.14.2/dist/gsap.min.js"></script>
<style>
body { margin:0; width:1920px; height:1080px; overflow:hidden; background:#0D1B2A; }
.scene { position:absolute; inset:0; width:1920px; height:1080px; overflow:hidden; background:#0D1B2A; }
#scene2 { z-index:2; opacity:0; }
.s1 { display:flex; flex-direction:column; justify-content:center; padding:120px 160px; gap:20px; }
.s2 { display:flex; flex-direction:column; justify-content:center; align-items:center; padding:100px 160px; gap:32px; }
</style>
</head>
<body>
<div id="root" data-composition-id="hyperframes-intro"
data-width="1920" data-height="1080" data-start="0" data-duration="5">
<div id="scene1" class="scene">
<div class="s1">
<div class="s1-title">HTML is Video</div>
<div class="s1-sub">Compose. Animate. Render.</div>
</div>
</div>
<div id="scene2" class="scene">
<div class="s2-title">Start composing.</div>
</div>
</div>>
<script>
window.__timelines = window.__timelines || {};
const tl = gsap.timeline({ paused: true });
// Scene 1: title entrance
tl.from(".s1-title", { x:-40, opacity:0, duration:0.5, ease:"power3.out" }, 0.25);
tl.from(".s1-sub", { y:15, opacity:0, duration:0.4, ease:"power2.out" }, 0.5);
// Blur crossfade transition
const T = 2.2;
tl.to("#scene1", { filter:"blur(8px)", scale:1.03, opacity:0, duration:0.35, ease:"power2.inOut" }, T);
tl.fromTo("#scene2",
{ filter:"blur(8px)", scale:0.97, opacity:0 },
{ filter:"blur(0px)", scale:1, opacity:1, duration:0.35, ease:"power2.inOut" }, T + 0.08);
window.__timelines["hyperframes-intro"] = tl;
</script>
</body>
</html>
Dikkat edilmesi gereken iki şey:
- Animasyon mantığı saf GSAP'tır. GSAP eğitimlerini görmüş herhangi bir model, bunun gibi zaman çizelgeleri yazabilir.
- HyperFrames ek yükü çok azdır. Kök öğede birkaç
data-özelliği. Başka hiçbir şey yok.
Bu dosyayı işleyin ve animasyonun 1920x1080 çözünürlükte bir MP4'ünü elde edersiniz. Metni değiştirin, renkleri değiştirin, yazı tiplerini değiştirin, bir logo ekleyin: tüm dosya düz HTML'dir.
Ajanın gerçekten kullanabileceği şeyler
Oluşturma işlem hattı gerçek bir tarayıcı olduğu için, herhangi bir web teknolojisi çalışır:
- Basit hareketler için CSS animasyonları ve geçişleri
- Karmaşık koreografi için GSAP zaman çizelgeleri
- Logolar, şekiller ve yol animasyonları için SVG
- Parçacık sistemleri veya üretken arka planlar için Canvas
- 3B sahneler için Three.js
- Veri görselleştirmeleri için D3.js
- İçe aktarılan After Effects animasyonları için Lottie
- Google Fonts veya özel kaynaklardan Web yazı tipleri
<video>veya<img>aracılığıyla yüklenen Arka plan videosu veya resimler
Sarmalayıcı yok, eklenti mimarisi yok, öğrenilecek bir çerçeve yok. Ajan zaten bildiklerini kullanır.
Ajanınıza tek komutla video düzenleme yeteneği nasıl verilir
HyperFrames, bir Claude Code yeteneği olarak gelir. Claude Code kullanıyorsanız, kurulum tek bir npm komutudur.
npx skills add heygen-com/hyperframes
Bu, HeyGen'in GitHub deposundan yeteneği getirir, araç zincirini kurar ve video düzenleme yeteneğini Claude Code'a kaydeder.
Kurulumdan sonra ajanıza doğal bir şekilde komut verin:
Yeni bir API için 10 saniyelik bir ürün tanıtım videosu oluştur.
Koyu bir degrade arka planla başla, ürün adını aşağıdan yukarı
kaydırarak ve soluklaşarak animasyonla göster, sonra ikonlu üç
madde işaretine geç, bir harekete geçirici mesaj kartıyla bitir.
Ajan HTML'i yazar, yerel bir önizleme çalıştırır ve son MP4'ü işler. API anahtarı yok. Harici hizmetler yok. Her şey makinenizde çalışır.
Claude Code olmadan kurulum
HyperFrames çerçeveden bağımsızdır. Kabuk komutlarını çalıştırabilen ve dosyaları okuyabilen herhangi bir ajandan çağrılabilir.
Depoyu klonlayın:
git clone https://github.com/heygen-com/hyperframes
cd hyperframes
npm install
Bir kompozisyon dosyası işleyin:
npx hyperframes render my-video.html --output my-video.mp4
Yerel olarak önizleme yapın:
npx hyperframes preview my-video.html
Önizleme komutu, tam bir işlemeye başlamadan önce zaman çizelgesini kaydırabileceğiniz ve kare kare doğruluğu kontrol edebileceğiniz bir tarayıcı penceresi açar.
Bu, geliştiriciler için neyin önünü açıyor
Birkaç kullanım durumu hemen ortaya çıkıyor.
Otomatik ürün pazarlaması. Ajanınız sürüm notlarını çekebilir, sahne sahne HTML oluşturabilir ve CDN'inize bir işlenmiş sürüm gönderebilir. Her sürüm, bir insanın zaman çizelgesine dokunmasına gerek kalmadan bir video alır.
Kişiselleştirilmiş video yanıtları. API webhook'ları, kullanıcı olayına göre kişiselleştirilmiş bir klip oluşturan bir ajanı tetikler. Hoş geldiniz videoları, makbuzlar, dönüm noktası kutlamaları, hepsi talep üzerine oluşturulur.
Veri hikaye anlatımı. Metrikleri bir ajana besleyin. Ajan, HyperFrames sahnelerine sarılmış D3 görselleştirmeleri yazar. Çıktı, gösterge tablonuzun anlatımlı bir gezintisi olup, her çeyrekte otomatik olarak yenilenir.
Podcast'ler veya uzun içerikler için dinamik B-roll. Bir ajan bir transkripti okur, her önemli noktayı gösteren hareketli grafikler oluşturur ve bunları sesin üzerine katmanlar.
API dokümantasyon videoları. OpenAPI spesifikasyonunuzu ayrıştırın, animasyonlu istek/yanıt diyagramlarıyla uç nokta incelemeleri oluşturun, paylaşılabilir klipler olarak dışa aktarın.
Apidog ile ajan orkestrasyonunu test etme
HyperFrames işleme adımını halleder. Yukarıdaki her şey orkestrasyondur: ajan döngüsü, araç çağrıları, LLM API istekleri ve hangi girdiden hangi videonun üretileceğine karar veren mantık.
Üretimde işlerin bozulduğu yer burasıdır. Hatalı araç yükleri, zaman aşımına uğramış API istekleri, yanlış tool_use_id referansları veya eşleşmeyen mesaj şemaları, tek bir kare işlenmeden video işlem hattını durdurur.
Apidog, HyperFrames'in kapsamadığı kısımlar için bir test ortamı sunar:
LLM uç noktalarını taklit edin. Ajanınızın beklediği tam şemaya sahip sahte bir Claude veya OpenAI uç noktasını Apidog'da oluşturun. Gerçek API maliyetleri devreye girmeden önce işlem hattınızın hatalı veya gecikmeli yanıtlara nasıl tepki verdiğini test edin.
Araç kullanımı yüklerini doğrulayın. Ajanınız harici API'leri çağırıyorsa (varlık alımı, stok görüntü aramaları veya marka kiti getirme için), bu uç noktaları Apidog'da kurun ve test senaryolarına zincirleyin. Baştan sona çalıştırmadan önce ajanın araç çağrı yapısının API'nizle eşleştiğini onaylayın.
Token tüketimini takip edin. Claude Opus 4.7, Opus 4.6'dan %35'e kadar daha fazla token üreten yeni bir token'laştırıcı kullanır. Zengin CSS ve 200 satır JavaScript içeren bir video kompozisyonu küçük değildir. Apidog'un kullanım takibi, maliyetler sizi şaşırtmadan önce istemlerinizi boyutlandırmanıza yardımcı olur.
Çok turlu ajan akışlarında hata ayıklama. Tam bir video işleme genellikle 5-10 LLM turu gerektirir (videoyu planla, sahneleri taslak hazırla, zamanlamayı revize et, animasyonları düzelt, sonlandır). Apidog, ajanın nerede yoldan çıktığını bulmak için tam konuşmayı tekrar oynatmanıza olanak tanır.
button
Felsefi argüman
HeyGen'in ekibi, "HTML, ajan tarafından oluşturulan video için uygun bir formattır" demekten daha güçlü bir iddiada bulunuyor. HTML'in, videonun geleceği için doğru format olduğuna inanıyorlar, hepsi bu kadar.
Bu mantık geçerli. Geleneksel video, Adobe, Blackmagic ve birkaç kodek satıcısı tarafından kontrol edilen özel formatlarda kilitlidir. HTML açık, standartlaştırılmış, sürümlenebilir, aranabilir ve dünyadaki her metin aracıyla düzenlenebilir.
HTML tabanlı video bir değişim formatı haline gelirse, videolar şunlar olur:
- Git'te fark edilebilir. Revizyonlar arasında neyin değiştiğini tam olarak görebilirsiniz.
- Bileşenleştirilebilir. Bir başlık kartı bir React bileşenidir. Bir hareketli grafik içe aktarılabilir bir modüldür.
- Duyarlı. Aynı kompozisyon, yeniden oluşturmaya gerek kalmadan 1080p, 4K veya dikey 9:16'da işlenir.
- Erişilebilir. Ekran okuyucular kaynağı ayrıştırır. Görsel öğeler için alt metin yerleşiktir.
- Aranabilir. Videolar içindeki metin, OCR'lenmiş pikseller değil, kelimenin tam anlamıyla metindir.
Bunların hiçbiri teorik değil. Bu özelliklerin her biri tarayıcıda zaten çalışıyor. HyperFrames, tarayıcıya özel içeriği alıp onu geçerli bir video kaynağı haline getiren köprüdür.
Bilmeniz gereken sınırlamalar
HyperFrames sürüm 1'dir. Birkaç gerçek kısıtlama:
- İşleme hızı karmaşıklığa bağlıdır. Three.js parçacıkları ve Canvas gölgelendiricileri içeren bir sahnenin kodlanması, basit bir GSAP metin animasyonundan daha uzun sürer. Buna göre plan yapın.
- Canlı video girişi sınırlıdır.
<video>etiketlerini gömebilirsiniz, ancak gerçek zamanlı kamera akışları veya yayın kaynakları daha fazla yapıştırıcı kodu gerektirir. - Ses desteği temeldir. Ses parçaları ekleyebilirsiniz, ancak gelişmiş miksaj (ducking, EQ, gürültü azaltma) hala FFmpeg son işlem gerektirir.
- Ajan yaratıcılığı hala modele bağlıdır. Opus 4.6 ve Gemini 3, düz istemlerden tutarlı, estetik açıdan çarpıcı çıktılar üreten ilk modellerdi. Opus 4.7 bu iş akışı için şu anda en iyisidir.
Bunların hiçbiri engelleyici değildir, ancak bir üretim hattı kuruyorsanız bunları göz önünde bulundurun.
Başlangıç kontrol listesi
HyperFrames'i hemen denemek istiyorsanız:
- [ ] Claude Code'u kurun (veya tercih ettiğiniz ajanı kullanın)
- [ ]
npx skills add heygen-com/hyperframeskomutunu çalıştırın - [ ] Ajanınıza basit bir 5 saniyelik video oluşturmasını söyleyin
- [ ] Çıktıyı işleyin ve MP4'ü inceleyin
- [ ] Tekrarlayın: stil, zamanlama veya sahne sayısını değiştirin
- [ ] API odaklı iş akışları için, LLM ve araç uç noktalarınızı Apidog'da kurun
- [ ] Gerçek bir video oluşturun (bir ürün tanıtımı, bir veri hikayesi, bir sürüm notu özeti)
- [ ] GitHub deposunu yıldızlayın: github.com/heygen-com/hyperframes
Sonuç
Yapay zeka ajanları yıllardır kod yazabiliyor. Şimdiye kadar, video düzenleme, insan müdahalesinin gerekli olduğu son büyük yaratıcı alandı. HyperFrames, ajanlarla zaten çalıştıkları yerde buluşarak bu bağımlılığı ortadan kaldırıyor: HTML, CSS ve JavaScript.
Yaklaşım, tek bir cümleyle açıklanabilecek kadar basit ve yayın kalitesinde hareketli grafikler üretebilecek kadar esnektir. Video çıktısına ihtiyaç duyan herhangi bir şey (pazarlama otomasyonu, kişiselleştirilmiş içerik, veri hikaye anlatımı, ajan odaklı dokümantasyon) geliştiriyorsanız, HyperFrames yığınınızda yer almalıdır.
Etrafındaki API ve orkestrasyon katmanı için, ölçeklendirmeden önce ajanınızın konuşmalarını, araç çağrılarını ve LLM isteklerini Apidog ile test edin. Başarısız API istekleri MP4 olarak işlenmez.
