.vtag: metadatafundamentet i VisionaryAI Suite
.vtag är metadatafundamentet i VisionaryAI Suite. Formatet lagrar AI-genererad kunskap bredvid originalfilen, vilket gör analysen portabel, strukturerad och redo för framtida arbetsflöden. Samma struktur driver semantisk filsökning och katalogindexering — så att ni kan söka i arkiv efter innehåll, inte bara filnamn.
Vad är en .vtag-fil?
En .vtag är en sidecar-fil med samma filnamn som originalfilen men annat filändelse. Innehållet är oftast JSON där strukturerad AI-analys samlas: taggar, beskrivningar, transkriptioner, objekt, tidslinjer, konfidensvärden och information om vilken modell som genererat resultatet. Eftersom filen är vanlig text kan den läsas, säkerhetskopieras, versionshanteras och indexeras av andra verktyg.
Varför sidecar-metadata är värdefull
Exempel (illustrativ JSON)
Det exakta schemat styrs av din version av VisionaryAI Suite. Exemplet nedan visar typiska fält; fältvärden kan vara på engelska i praktiska arbetsflöden.
{
"vtag_version": "1.0",
"media": "interview_0445.mp4",
"summary": "Outdoor interview, traffic noise, two speakers",
"tags": ["interview", "outdoor", "car_passes"],
"objects": [
{ "label": "person", "t": 12.4, "confidence": 0.89 }
],
"caption": { "text": "Reporter with microphone, building facade behind", "confidence": 0.78 },
"transcript": { "text": "…we filed the request under the public record law…" },
"speakers": [ { "id": "spk1", "label": "Reporter" } ],
"timeline": [ { "t0": 0, "t1": 3.1, "event": "siren" } ],
"confidence": { "overall": 0.81 },
"engine": { "name": "VisionaryAI Suite", "build": "0.0.0" }
}
Vad som kan lagras i .vtag
Version 1.5.3 berikar vad som kan flöda in i varje sidecar. .vtag är utformat för att vara portabelt, strukturerat och framtidssäkert — med AI-genererad kunskap bredvid originalfilen:
AI-genererade beskrivningar
Naturliga sammanfattningar och scennarrativ för snabb sortering och sökkort.
Taggar
Strukturerade nyckelord och begrepp som kan kopplas till ert taxonomi- eller katalogsystem.
OCR-text
Synlig text från dokument, skärmdumpar, affischer och innehåll på skärmen — sökbart tillsammans med visuell analys.
Transkriptioner
Tal-till-text från ljud och video för nyckelord och fraser i långa inspelningar.
Tidslinjedata
Tidsstämplar och intervall som kopplar händelser till specifika ögonblick i filen.
Detekterade objekt
Personer, föremål och regioner som grundar sökning i materialets visuella struktur.
Talarinformation
Talarroller eller diariseringsdata när sådan analys ingår.
Visuella fynd
Bildrutebaserade observationer och scenbevis från multimodal analys.
Semantiska sammanfattningar
Högre nivå av tolkning som förenar flera signaler till sammanhängande kontext.
Djupare AI-tolkning
Sammanfogad multimodal förståelse — vision, tal, OCR och metadata på tidslinjen.
Konfidensvärden
Låg konfidens kan flaggas eller nedprioriteras; du behåller kontrollen och kan granska resultat manuellt.
Analyskällor
Metadata om vilka modeller och analyssteg som använts — viktigt för spårbarhet.
Öppet format framför sluten leverantörsdatabas
En tjänsts interna databas kan vara kraftfull, men metadata bör ofta kunna ägas och flyttas långsiktigt. Med .vtag som läsbar sidecar-fil kan analysresultat tas med till andra verktyg utan att hela AI-analysen behöver köras om — om ni inte väljer att uppgradera modeller medvetet.
Samspelet med XMP och mediearkiv
Många arbetsflöden använder XMP i stillbilder medan DAM-system och kataloger har egna databaser. För video och ljud räcker inbäddad metadata ofta inte till omfattande AI-analys. .vtag kompletterar med rik metadata som kan mappas stegvis till XMP, databaser eller NeoFinder — utan att ersätta varje katalogsystems egna cache och index.
Utveckling av formatet
Som öppet mönster kan fält, delade scheman och validering utvecklas tillsammans med ekosystemet. Målet är en portabel, granskningsbar metadatafil kring det som analyserats i ert material — som stöd för sökning, arkiv och integration, inte som ersättning för juridiska krav, bevarandeplikt eller mänsklig katalogisering där sådana krav gäller.