ChatGPT med klar opfordring til politikerne: Anerkend at borgere kan have seksuelle relationer uden at voldtage nogen
ChatGPT med opsang til djøf'erne
Hvordan bruger man egentligt OpenAI's værktøjskasse i forhold til sit eget bagkatalog?
Jeg har mange af mine tekster, men desværre langt fra alle, liggende lokalt på min computer.
Hvordan kan jeg forstå over ti tusind tekster? Hvordan kan jeg huske alt det jeg har skrevet? Hvordan kan jeg finde mening og betydning i det?
Forhåbentligt med hjælp fra de store sprogmodeller og mere specifikt det man kalder semantisk søgning og embeddings.
Lad os tage et konkret eksempel med et emne som jeg har været meget omkring.
Sagen er den at jeg i mange år har skrevet om djøfisering.
Men det kan jo være svært at huske det hele.
En løsning ville være at læse det hele igen. Læse alt det som jeg selv tidligere har skrevet. Det ville nok tage i hvert fald en time alene på emnet djøfisering.
Så jeg tænkte at jeg ville afprøve langchain
med noget semantisk søgning i mit eget baggrundsmateriale i stedet for at læse mig slavisk igennem et stor antal tekster.
Med lidt hjælp fra Nushell og A plain text note-taking assistant kan jeg hurtigt finde alle mine tekster hvor jeg nævner djøfisering, og jeg kan også vælge kun at gemme brødteksten -- så filen jeg skal analysere i næste trin, ikke bliver alt for rodet.
zk list -f {{body}} -m djøfisering | save kilde.txt
Nu har jeg samlet alt mit materiale om djøfisering i en enkelt fil som jeg kalder kilde.txt
.
Jeg installerer så langchain og chromadb for at arbejde videre med analysen af indholdet.
Konkret gør langchain her det at jeg kan bruge OpenAI - både den generative del og deres embeddings model som er velegnet til semantisk søgning.
Lige pludselig kan jeg forholde mig til store mængder af mit eget indhold. Langt mere end der kan være i en enkelt chat, for eksempel. Den token limit man normalt er underlagt kan slet ikke klare bare en brøkdel af mit bagkatalog alene inden for området djøfisering.
Efter lidt installation kan jeg importere min tekstfil om djøfisering i langchain sådan her:
>>> loader = TextLoader('kilde.txt')
>>> from langchain.indexes import VectorstoreIndexCreator
>>> index = VectorstoreIndexCreator().from_loaders([loader])
Det foregår gennem python, så det satte jeg mig lidt ind i også.
Nå, men nu kan jeg endelig stille spørgsmål til mine egne tekster.
Jeg lagde ud sådan her:
>>> query = "hvad er djøfisering så for noget synes du"
>>> index.query_with_sources(query)
Og efter at have tænkt lidt over det spørgsmål svarede langchain mig som følger:
{'question': 'hvad er djøfisering så for noget synes du', 'answer': ' Djøfisering er en form for bureaukratisering og kontraktliggørelse af sexlivet, hvor verbalisering og skriftliggørelse af en før underforstået aftale bidrager til at færre bagefter føler deres grænser overtrådt.\n', 'sources': 'kilde.txt'}
Så jeg har åbenbart skrevet om djøfisering i forbindelse med samtykkelovgivning.
Lad os prøve med et spørgsmål mere:
>>> query = "har djøfisering en betydning for den almindelige borger"
>>> index.query_with_sources(query)
{'question': 'har djøfisering en betydning for den almindelige borger', 'answer': ' Djøfisering har betydning for den almindelige borger, da det har ført til mere smagsdommeri, bureaukrati og kontraktliggørelse af samfundet. Dette har blandt andet konsekvenser for sexlivet, hvor der er kommet mere formalisering og verbalisering af samtykke. Det har også ført til flere råd og kommissioner, som har forsinket forbedringer for almindelige mennesker.\n', 'sources': 'kilde.txt'}
Godt så.
Nu prøver vi noget lidt sværere:
(og her skulle den "tænke" meget længe)
Men hold nu op hvor er svaret dog konkret og ganske glimrende:
>>> query = "hvordan stopper vi yderligere djøfisering af samfundet"
>>> index.query_with_sources(query)
{'question': 'hvordan stopper vi yderligere djøfisering af samfundet', 'answer': ' Der er flere muligheder for at stoppe yderligere djøfisering af samfundet, herunder at reducere antallet af råd og kommissioner, anerkende at borgere kan have seksuelle relationer uden at voldtage nogen, og reducere brugen af juridiske konstruktioner.\n', 'sources': 'kilde.txt'}
Her er svaret trukket ud så det er nemmere at overskue:
Der er flere muligheder for at stoppe yderligere djøfisering af samfundet, herunder at reducere antallet af råd og kommissioner, anerkende at borgere kan have seksuelle relationer uden at voldtage nogen, og reducere brugen af juridiske konstruktioner.
Det er sjovt på den måde at se sine gamle tekster få nyt liv.
Det er en helt anden måde at forholde sig til sit bagkatalog på end for eksempel bare fritekstsøgning med snippets.
Kom med
I mere end et årti har Lennart Kiil leveret sandhed, nuancering og perspektiv med præcision og lidenskab. Som chef og redaktør for Folkets Avis, Danmarks banebrydende borgerjournalistiske medie, har han ufortrødent gået oplysningens ærinde og trodset modstand og økonomiske vanskeligheder.
Invester i ærligt, indsigtsfuldt og originalt indhold, og stå bag en fritænker, der er kendt for kompromisløs research og frygtløs sandhedssøgning.