Zbudowałem drugi mózg. Trafiłem w standard Google (OKF)

Zbudowałem drugi mózg. Okazało się, że w 100% trafiłem w standard Google (OKF)
Jakiś czas temu opisałem, jak LLM Wiki Karpathy'ego pomogła mi uporządkować moją bazę wiedzy - ponad 300 notatek, którymi zarządza agent, trzy indeksy nawigacyjne, workflow do ingestu i kompilacji. System działa. Codziennie. To mój drugi mózg.
Ale ostatnio złapałem się na niewygodnym pytaniu. Cała ta wiedza żyje w moich narzędziach - w Obsidian, w Quartz, w moim CLAUDE.md. A co, jeśli zechcę ją komuś przekazać? Zmienić tool? Albo potraktować jako aktyw firmowy, który ma przeżyć dowolny program i dowolny model? Notatki zamknięte w czyimś prywatnym formacie to vendor-lock-in - tyle że zrobiony własnoręcznie.
Wniosek, do którego doszedłem, jest prosty: trwałość wiedzy to nie narzędzie - to format. I wtedy trafiłem na OKF (Open Knowledge Format) od Google. Zrobiłem audyt swojego brain pod kątem tego standardu, spodziewając się sporego rozjazdu. Wynik mnie zaskoczył: zgodność w okolicach 100% - mimo że nigdy nie projektowałem brain pod OKF. W tym artykule pokażę, dlaczego tak się stało, co dokładnie sprawdziłem i co wtedy, gdy czysty markdown to za mało. Bez teorii - konkretny audyt i konkretne liczby.
Czym jest OKF (Open Knowledge Format)
OKF to otwarty format zapisu wiedzy, zaprojektowany pod erę agentów. Technicznie nie ma w nim magii: to markdown + frontmatter YAML. Cała filozofia mieści się w jednym haśle wzorca - „authored by people, generated by agents" (tworzą ludzie, generują i utrzymują agenci). Dokładnie ten podział, który u siebie wypracowałem organicznie.
Podstawową jednostką jest Knowledge Bundle - katalog plików .md. Może być repozytorium git, tarballem albo podkatalogiem. I to jest sedno przenośności: git clone i masz całość. Wewnątrz Concept to jedna myśl - jeden plik .md = jeden koncept (frontmatter plus treść markdown). Format rezerwuje dwie nazwy plików: index.md (listing katalogu pod progressive disclosure) oraz log.md (chronologia zmian, najnowsze u góry).
Najciekawsza jest minimalna bariera wejścia. Jedyne twardo wymagane pole frontmattera to type. Cała reszta - title, description, resource, tags, timestamp - jest zalecana, ale opcjonalna. Producent może dodawać własne klucze, a konsument musi tolerować nieznane pola i broken links. Najprostszy zgodny koncept wygląda tak:
---
type: note
---
Treść notatki w czystym markdownie.
Warto rozumieć różnicę między OKF a LLM Wiki. OKF to specyfikacja interoperacyjności - mówi „jak zapisać wiedzę, żeby była wymienialna". LLM Wiki to metodologia pracy - mówi „jak agent ma tę wiedzę budować i utrzymywać". To dwie komplementarne warstwy, a nie konkurencja.
Jedna uczciwa uwaga. Repozytorium OKF ma wprost notkę: „This repository and its contents are not an official Google product". OKF to otwarta specyfikacja interoperacyjności, a nie produktowe zobowiązanie Google.
Mój brain trafił w standard - choć go pod niego nie projektowałem
To jest serce tej historii. Zrobiłem realny audyt zgodności brain z OKF v0.1. Werdykt jednym zdaniem: brain przechodzi 100% twardych warunków conformance OKF v0.1; rozbieżności są wyłącznie w warstwie rekomendowanej, czyli kosmetyce.
Spec definiuje trzy twarde warunki zgodności. Brain spełnia wszystkie trzy:
| # | Wymóg OKF | Status | Dowód w brain |
|---|---|---|---|
| 1 | Każdy nie-zarezerwowany .md ma parsowalny YAML frontmatter | ✅ | Każda nota otwiera się --- ... --- |
| 2 | Każdy frontmatter ma niepuste type | ✅ | type: basic-note | book-note | knowledge-note | tool | compiled-note | answer-note |
| 3 | Pliki zarezerwowane mają właściwą strukturę gdy istnieją | ✅ | Brain nie używa literalnych index.md/log.md → funkcję pełnią _indexes/*; warunek „gdy istnieją" spełniony |
Liczby na głos: twarda zgodność = 100% (3/3). Warstwa rekomendowana (te wszystkie opcjonalne pola i konwencje) to ~85-90%. I tu robi się ciekawie, bo wszystkie cztery rozbieżności są nazewniczo-składniowe - dotyczą tego, jak coś nazwałem, a nie tego, jak modeluję wiedzę:
| Obszar | OKF | brain | Charakter |
|---|---|---|---|
| Linki | [label](/path) | [[wikilinks]] (Obsidian) | składnia; Quartz kompiluje do [label](path) w buildzie |
| Indeks | literalny index.md | _indexes/vault-map.md + catalog.md + graph.md | nazwa, nie funkcja |
| Log | log.md | sekcja ## Recent Changes w _indexes/vault-map.md + historia git | rola w sekcji, nie w osobnym pliku |
| Klucze frontmattera | description / resource / timestamp | summary / source / date | mapowalne 1:1 przy eksporcie |
Spójrz na kolumnę „Charakter". Nigdzie nie ma „brakuje mi tej koncepcji" - wszędzie jest „nazwałem to inaczej" albo „narzędzie kompiluje to za mnie". Wikilinks Obsidian są pełnoprawnymi linkami OKF po buildzie Quartz. _indexes/ pełni dokładnie rolę index.md. Pola mapują się jeden do jednego.
„Zgodność nie jest przypadkiem - brain i OKF wyrastają z tej samej koncepcji LLM Wiki Karpathy'ego. OKF to spec interoperacyjności, brain to działająca implementacja. Różnice to wybory narzędzia, nie różnice modelu wiedzy."
To jest konwergentna ewolucja. Dwa systemy budowane niezależnie - specyfikacja w Google i mój vault w Obsidian - zbiegły się do tego samego kształtu, bo wyrosły z tej samej idei. I właśnie dlatego standard jest wiarygodny: nie wymyślono go zza biurka, tylko spisano to, do czego praktyka i tak dąży.
Dlaczego format ma znaczenie
Można zapytać: skoro mój system działa, po co mi w ogóle standard? Odpowiedź to pięć konkretnych rzeczy, które daje format - a których nie da żadne pojedyncze narzędzie:
- Przenośność. „If you can git clone it, you can ship it." Bundle to repozytorium - kopiujesz całość i działa u kogokolwiek, bez instalacji, bez konfiguracji, bez zależności od mojego setupu.
- Interoperacyjność. Bundle wiedzy można wymieniać niezależnie od narzędzia. Eksport z mojego brainu, import do cudzego. To realny przyszły kierunek produktowy - ekstrakt bazy jako gotowy bundle OKF.
- Trwałość i future-proofing. Narzędzia umierają, format zostaje. Markdown plus frontmatter przeżyje Obsidian, przeżyje Quartz, przeżyje konkretny model LLM. Za pięć lat wciąż otworzysz te pliki.
- Czytelność podwójna. Ten sam plik czyta agent i człowiek. Bez żadnego toola wystarczy go otworzyć w edytorze - to nie baza w zamkniętym formacie binarnym.
- Aktyw, nie silos. Wiedza zapisana w standardzie staje się zasobem, który da się audytować, przekazać i wycenić. I to jest most do kolejnego pytania - co, gdy ten aktyw rośnie do skali firmy.
Gdy czysty markdown to za mało - Google Knowledge Catalog
Tu zmieniam ton na ostrożny. Tego fragmentu nie testowałem - sygnalizuję kierunek, nie wystawiam rekomendacji.
Karpathy sam zakreśla skalę, na której to podejście działa: „moderate scale (~100 sources, ~hundreds of pages)" - zanim potrzebny staje się embedding-based search. Mój brain to dziś rzędu 300 notatek, czyli wciąż ten przedział: czysty markdown z indeksami ogarnia go bez embeddings i bez infrastruktury RAG. W poprzednim artykule pokazywałem ten mechanizm w liczbach: progressive disclosure daje tam około 30× mniej kontekstu na zapytanie niż wrzucanie całego vaulta. To nie twardy limit - raczej rząd wielkości, do którego index-first pozostaje wygodny. Na osobisty drugi mózg w zupełności wystarcza. Ale powyżej - przy milionach dokumentów, danych ustrukturyzowanych i nieustrukturyzowanych jednocześnie, wielu agentach pracujących równolegle - to inna liga.
Tu wchodzi Google Knowledge Catalog (managed, wg strony produktu „formerly Dataplex"). Google opisuje go jako „universal context engine for your enterprise" - „always-on context and governance for your agents". Zamiast Twoich notatek kataloguje cały data estate: automatycznie zbiera metadane z BigQuery, AlloyDB, Spannera czy Lookera, a źródła nieustrukturyzowane - PDF-y, kontrakty, wiki - zamienia w „structured knowledge graph", który agent może odpytać. To samo repozytorium (GoogleCloudPlatform/knowledge-catalog), które zawiera katalog okf/, trzyma też samples/ i toolbox/.
Widać tu ciągłość, nie przeskok. Ta sama idea - wiedza ustandaryzowana, semantyczna, czytelna dla agentów - tyle że na poziomie przedsiębiorstwa. OKF i LLM Wiki to skala osobista; Knowledge Catalog to skala firmowa. Jeden łańcuch, dwa końce.
Gdzie dokładnie jest granica? To nie jest „local vs cloud" - mój brain też stoi w chmurze. Różnica jest jakościowa, na czterech osiach:
- Co katalogujesz. Brain = Twoje autorskie notatki. Catalog = warstwa semantyczna nad całym, żywym data estate firmy: tabele, hurtownie, pliki, modele BI.
- Silnik retrieval. Brain = index-first plus progressive disclosure, bez embeddings. Catalog = semantic search z sub-sekundową latencją nad knowledge graphem milionów encji.
- Governance. Brain = git i konwencje. Catalog = polityki dostępu (IAM), data quality, lineage, audyt - retrieval respektuje uprawnienia, więc agent widzi tylko to, do czego ma prawo.
- Świeżość i współbieżność. Brain = snapshot, który sam utrzymujesz. Catalog = always-on, aktualizuje się wraz z danymi i obsługuje wielu agentów naraz przez Context API i MCP tools.
Liczba plików to tylko objaw. Prawdziwa granica to typ danych plus silnik retrieval plus governance plus dynamika. Dla osobistej wiedzy w prozie czysty markdown wygrywa prostotą; dla firmowego, heterogenicznego data estate potrzebujesz warstwy pokroju Knowledge Catalog.
I jeszcze raz, bo to ważne: repozytorium OKF nosi notkę „not an official Google product", a Knowledge Catalog opisuję tu wyłącznie jako kierunek, którego sam nie wdrażałem. Bez obietnic co do funkcji produktu.
Co z tego wynika
- Format wygrywa z narzędziem. Jeśli budujesz bazę wiedzy, projektuj ją pod standard od pierwszego dnia. Migracja później kosztuje - zgodność od startu jest darmowa.
- Zgodność bywa konwergentna. Jeśli twój system wyrasta z dobrej idei (LLM Wiki), masz szansę trafić w standard bez celowania w niego. To dobra wiadomość: nie musisz przepisywać brainu, prawdopodobnie wystarczy go wyeksportować.
- Wiedza w standardzie to aktyw. Przenośny, audytowalny, wymienialny - i skalujący się od osobistego brain po Knowledge Catalog.
Jeśli chcesz zacząć z gotowym fundamentem, udostępniam szablon second-brain-template - „Use this template", /onboard, pierwszy ingest i masz własny system zgodny ze standardem w kilka minut. Pracuję też nad szerszymi materiałami o budowaniu drugiego mózgu - jeśli temat cię interesuje, warto trzymać rękę na pulsie.
Chcesz bazę wiedzy, która jest Twoja na zawsze - przenośna i gotowa dla agentów?
Pomogę Ci zaprojektować architekturę bazy wiedzy zgodną ze standardem (OKF) - od struktury notatek i indeksów po skalę firmową. Możesz też wziąć darmowy szablon i odpalić własny system w kilka minut.
Umów bezpłatną konsultacjęPrzydatne zasoby
- Jak LLM Wiki Karpathy'ego pomogła mi uporządkować bazę wiedzy - bazowy artykuł o LLM Wiki, progressive disclosure i architekturze brainu
- Second brain w Obsidian i Claude Code - jak zacząć od zera
- brain.lipowczan.pl - żywa instancja mojego drugiego mózgu
- second-brain-template - gotowy szablon do startu
- OKF / knowledge-catalog (repo) - specyfikacja OKF w katalogu okf/ (uwaga: „not an official Google product")
- Google Knowledge Catalog - managed platforma katalogu danych (skala enterprise)
FAQ
Czym jest Open Knowledge Format (OKF) i kto za nim stoi?
OKF (Open Knowledge Format) to otwarta specyfikacja zapisu wiedzy oparta na markdown plus frontmatter YAML, zaprojektowana pod pracę z agentami AI. Specyfikacja żyje w repozytorium GoogleCloudPlatform/knowledge-catalog w katalogu okf/. Ważna uwaga: repozytorium nosi notkę „This repository and its contents are not an official Google product" - to otwarty standard interoperacyjności, nie produktowe zobowiązanie Google.
Czym OKF różni się od LLM Wiki Karpathy'ego?
OKF to specyfikacja interoperacyjności - definiuje, jak zapisać wiedzę, żeby była przenośna i wymienialna między narzędziami. LLM Wiki to metodologia pracy - opisuje, jak agent ma budować i utrzymywać bazę wiedzy. Są komplementarne: OKF mówi o formacie, LLM Wiki o procesie. Działająca baza wiedzy korzysta z obu warstw naraz.
Jedyne wymagane pole w OKF to type - co to oznacza w praktyce?
Oznacza minimalną barierę wejścia: zgodny plik OKF musi mieć tylko niepuste pole type we frontmatterze, a cała reszta (title, description, tags, timestamp) jest opcjonalna. Producent może dodawać dowolne własne klucze, bo konsument formatu musi tolerować nieznane pola i broken links. Dzięki temu standard jest liberalny przy zapisie, a rygorystyczny tylko tam, gdzie to konieczne.
Czy moja istniejąca baza w Obsidian jest zgodna z OKF?
Najprawdopodobniej w dużej części tak, zwłaszcza jeśli używasz plików .md z frontmatterem. W moim audycie brain przeszedł 100% twardych warunków conformance OKF v0.1 (3/3), a rozbieżności były wyłącznie kosmetyczne. Wikilinks [[...]] Obsidian kompilują się przez Quartz do linków [label](path), a pola jak summary czy date mapują się jeden do jednego na description i timestamp przy eksporcie.
Kiedy czysty markdown przestaje wystarczać i wchodzi Google Knowledge Catalog?
Podejście index-first na czystym markdownie działa świetnie w skali osobistej - rzędu setek notatek (mój brain to dziś nieco ponad 300), bez embeddings i bez infrastruktury RAG. To nie twardy limit, tylko rząd wielkości. Powyżej - przy milionach dokumentów, danych ustrukturyzowanych i nieustrukturyzowanych oraz wielu agentach naraz - wchodzi skala enterprise, którą adresuje Google Knowledge Catalog (managed, „formerly Dataplex"). Zaznaczam jednak, że tego progu osobiście nie testowałem - sygnalizuję kierunek, nie rekomendację produktową.