UR Samtiden - Gräv 2016

Om UR Samtiden - Gräv 2016
Journalister och sakkunniga talar om grävande journalistik, om berättande och om nya medieplattformar som förändrar framtidens medier. Inspelat den 8 och 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
Dela serien
Dela serien på FacebookDela serien på TwitterDela serien på PinterestDela serien via e-post Kopiera länkTangentbordskontroller för spelaren
- ␣Mellanslag,
- ↵Retur:
- Spela / pausa programmet
- M
- Ljud på / av
- ↑Pil upp:
- Höj ljudvolymen
- ↓Pil ned:
- Sänk ljudvolymen
- →Pil höger:
- Hoppa framåt 5 sekunder
- ←Pil vänster:
- Hoppa bakåt 5 sekunder
- 0 - 9
- Hoppa direkt till 0% - 90% av programmets längd
- C
- Välj språk för undertextning
- F
- Visa spelaren i helskärmsläge
- Esc
- Avsluta helskärmsläge

Välkomna till det här föredraget
av Mar Cabra--som är chef för dataenheten vid ICIJ-
-den organisation
som har lagt grunden--till de otroliga avslöjandena
i Panamadokumenten.Vi känner varandra sen länge-
-och Mar är en av de mest energiska,
smartaste kvinnorna jag känner.Det är alltid ett nöje
att få lyssna på henne. - Var så god.Tack, Helena.
Jag ska anlita Helena
till att alltid presentera mig.Jag jobbar på International Consortium
for Investigative Journalism.ICIJ är först och främst
ett nätverk av reportrar--ett nätverk av över 190 journalister
i över 65 länder--som arbetar tillsammans
med undersökningar.Vår största undersökning offentlig-
gjordes nyligen, Panamadokumenten.Där hade vi ett ännu större team med
mediaorganisationer i hela världen.I vanliga fall är vi ett nätverk
av 190 journalister i 65 länder.Men vi har väldigt liten personalstyrka.
Vi har tolv heltidsanställda
över hela världen.Vårt högkvarter finns i Washington DC,
men vi har folk i Costa Rica--Venezuela, Tyskland,
Frankrike och Spanien.För några år sen
hade vi ingen datakapacitet.All databehandling utfördes
av utomstående konsulter.En stor förändring var-
-när vi tog in experter på data
och teknik in i organisationen.Jag är chef för ett team som utgör
hälften av all vår personal nu--flera år senare,
data- och forskningsenheten.Det är team av programmerare och
journalister som arbetar tillsammans--med dataanalys,
med att skapa undersökningsverktyg--och även med att göra visualiseringar.
Som ni kan se
är jag inte ansvarig för grafiken.Jag har gjort så gott jag har kunnat.
För mig är det väldigt viktigt
att jag har en direktlinje--till vår vicechef,
för att undvika all byråkrati.Många av er arbetar för stora
organisationer och vet vad jag menar.Min roll är i princip
att vara som en flygledare--som håller koll på allt och som ser
till att mitt team har allt de behöver.Vi gör två olika sorters jobb.
Vi kan vara inbäddade i ett projekt--så att vi har en datajournalist
med från början--och en programmerare som gör
analyser eller jobbar med databaser--med från början, som en reporter till.
Vi kan också hjälpa till med väldigt
specifika saker på undersökningssidan.Vi kan göra genomgångar
av databaser på nätet.Vi ville till exempel undersöka
om Luxemburg var ett skatteparadis--så då samlade vi in data
från Luxemburgs bolagsregister--för att visa att tusentals företag
delade på samma adress.Vi kan också hjälpa publikationer
med visualisering och databaser--som hjälper till med berättandet. Nån
frågade när vi börjar med berättandet.Vi börjar ganska tidigt. Vi pratar med
reportrar, redaktörer och projektledare--tidigt i processen,
för om vi inte börjar arbeta tidigt--finns det inget vi kan göra
i sista minuten.Vi försöker vara med i projekt
och hjälpa till från början.Jag tänkte förklara
för er hur vi har arbetat--främst med de läckor som vi har fått.
Vi har fått in läckor om skatteflykt-
-den här parallella ekonomin
som eliten använder--för att skapa parallella identiteter
i skatteparadis för att dölja vem de är.De åker till Jungfruöarna, Panama
eller Singapore och skapar ett företag--där man inte kan få reda på
vem som står bakom företaget.I stället för Mar Cabra är jag Sunny
Sunshine AB och kan göra vad jag vill.Jag kan åka till Schweiz, jag kan ha lån
i Spanien och en fastighet i London--utan att det går att spåra till mig.
Att ha ett företag
i ett skatteparadis är helt lagligt.Det som är olagligt är att inte berätta
om det för skattemyndigheten hemma.Vi har blivit
de man kontaktar inom ICIJ--när man jobbar med skatteflykt,
och vi har fått in läckor om det--som har fått oss
att ställa frågor om systemet--och hur vi jobbar på ICIJ.
En snabb genomgång.
2013 publicerade vi ett antal läckor--och vi publicerade
en andra omgång läckor i januari 2014.Det var 260 GB information
och ungefär två miljoner dokument--om runt 100 000 företag
i skatteparadis.2015 arbetade vi med ett projekt
som hette Luxembourg Leaks--där vi fick tillgång till
över 500 hemliga skatteavtal--mellan företag och staten Luxemburg.
Det var pdf-dokument--som var signerade av företrädare
för Luxemburg och inskannade--av en revisionsbyrå,
och vi fick en kopia av de avtalen.Senare arbetade vi med Swiss Leaks,
som publicerades för runt ett år sen--och handlade om
bankkonton i banken HSBC.Det handlade om över 100 000 kunder
hos HSBC i Schweiz--och ungefär 100 miljarder dollar.
Så vi trodde att vi hade gjort allt-
-när två reportrar från
Süddeutsche Zeitung kontaktade oss--och sa: "Vi har fått världshistoriens
största läcka. Vi vill jobba med er."Så vi har precis publicerat
Panamadokumenten.Här ser ni en storleksjämförelse.
Vi trodde att vi hade gjort allt--att vi var bra på att behandla data,
och att 260 GB var mycket.Sen fick vi 2,6 TB
med 11,5 miljoner dokument--så vi blev tvungna att förbättra
de plattformar och verktyg som vi hade.Jag ska prata om de verktyg
vi använde för det här samarbetet--som å ena sidan
är historiens största läcka--med 2,6 TB
och 11,5 miljoner dokument--men det är även det största
journalistiska samarbetet i historien--där över 370 reportrar i 80 länder
och över 100 mediaorganisationer--arbetar tillsammans i tystnad,
utan att läcka nånting--med målet att publicera den 3 april.
Vi arbetade mot det målet i ett år,
att publicera den 3 april och efter det.Jag vet inte hur det blir med tiden. Det
är första gången jag pratar om det här--eftersom vi publicerade i söndags.
Räck upp handen om ni har frågor--så ska vi försöka
besvara dem efter hand.Första gången vi får läckor
eller nån annan information till ICIJ--är den första frågan vi ställer
hur vi kan arbeta med det--och hur vi kan göra det tillgängligt.
Allt vi gör på ICIJ är ett samarbete.Vi samarbetar internt
med människor i olika länder.Som jag sa har vi folk
i Spanien, Washington, Venezuela...Vi måste hitta ett sätt
att samarbeta på global nivå--och sen tar vi in ett reporterteam.
Vi måste se till att reportrar från
olika länder kan arbeta tillsammans.Jag ska prata om
hur vi kommunicerar lite senare--men först vill jag förklara
vad vi gör med dokumenten.Det här handlar inte bara om läckor.
Jag ska berätta om läckor--men det här gäller alla nyheter.
I Spanien, till exempel,
har vi ett väldigt slutet system--och rättegångsprotokoll
är inte offentliga.Det enda som är offentligt är domen,
som är anonymiserad.Men reportrar behöver få tillgång
till rättegångsdokument.På redaktionerna i Spanien finns
massor med rättegångsdokument.Vi har haft flera stora korruptions-
skandaler i Spanien, och i ett fall...El País, som är den största tidningen
i Spanien, fick en läcka--med sexton sidor med dubbel
bokföring från det styrande partiet.Det visade hur de tog emot mutor-
-eller åtminstone
att de inte bokförde alla inbetalningar.Det fanns namn
i de sexton dokumenten.Men eftersom de inte hade
nån central samling med dokument--tog det nästan en vecka att koppla
ihop namnen på dokumenten--med folk som var inblandade
i korruptionshärvorna.Om de hade haft en samling
med alla "halvofficiella" dokument--hade de hittat det på en gång.
Jag pratar om läckor, men det här
gäller alla samlingar av dokument.Ni har säkert väldigt många dokument
på era redaktioner.Vår första fråga
är alltid vad vi har framför oss--vilka slags dokument,
eller vilka slags filer som vi har.Vi försöker extrahera rå text.
Om det är ett Word-dokument
är det enkelt, för då finns texten där--men om det är en bild,
som ett skannat dokument--kan formatet vara tiff eller jpeg,
och då måste vi extrahera texten.Det måste göras allra först,
för om dokumentet inte är sökbart--och om maskinen inte kan läsa det
är det oanvändbart.Vi försöker också extrahera metadata,
sånt som skapelsedatum--vem som skapade det
och viss annan information.Vi vill också lägga in det i en databas,
som det går att söka i.Vårt projekt bygger på öppen källkod.
Jag ska visa en lista på vilka verktyg
vi använder om en liten stund.Det här är hur det fungerar.
Den ser vilket slags fil vi har, och om
den har bilagor eller inbäddade objekt--och utifrån det frågar den
om vi vet hur vi ska extrahera texten--om det är ett elektroniskt dokument
eller om det är en bild.Sen går den vidare med OCR, optisk
teckenigenkänning, om det är en bild--och går igenom
dokument efter dokument.Det är en automatisk process.
Om ni nånsin har behövt göra OCR
på ett antal pdf-filer--vet ni att det är en mardröm
att göra det manuellt.Vi har automatiserat processen.
Det är inte riktigt så enkelt--men i korta drag kopplar vi in
hårddisken, sätter i gång processen--och så börjar den gå igenom
dokument efter dokument.Om den inte förstår formatet
lägger den dokumentet åt sidan--för att ta hand om det senare.
Den går igenom alla dokument.Dessutom tittar den på bilagor.
De läckor som vi har fått
består av många mejl med bilagor--som också måste behandlas.
Så nu har vi fått historiens största
läcka på 11,5 miljoner dokument.Det var många mejl,
men också många pdf-filer och bilder.Det vi fick i Panamadokumenten
var i princip alla interna dokument--från advokatbyrån Mossack Fonseca,
en av de största i världen--som sysslar med offshore-företag.
De arbetar i 21 olika länder,
som Panama och Jungfruöarna--men också på platser som man
kanske inte ser som skatteparadis--som Wyoming och Nevada i USA.
Storbritannien kan i vissa fall vara ett
skatteparadis, så de hade företag där.De fanns på 21 olika platser runt om
i världen, ofta små öar i Stilla havet--som jag inte ens visste fanns förut.
11,5 miljoner interna dokument
från den här advokatbyrån.Tänk er att nån stjäl eller får tag på
ert företags alla interna dokument--och allt som ni har i era datorer.
Vad skulle det vara?
Mejl, pdf-filer, foton, allt möjligt.Vi fick också
Mossack Fonsecas interna databas--med namn på över 200 000 företag i
skatteparadis och människorna bakom.Av 11,5 miljoner dokument
behövde ungefär hälften bearbetas.Ni kan tänka er den här processen...
Vi stoppar in hårddisken med 2,6 TB-
-och maskinen börjar gå igenom
dokument efter dokument.Om vi skulle göra så
skulle det kunna ta väldigt lång tid--särskilt extraktionen av text
med hjälp av OCR.Det här är en uträkning. Med tre
miljoner filer och tio sekunder per fil--skulle det ta ett helt år att behandla
alla dokument. Vi har inte ett år.Vi skulle kunna hinna dö.
Vi behövde skapa en armé av servrar--som kunde hjälpa oss
bearbeta det här snabbare.Vi laddade upp informationen i molnet-
-och hos Amazon skapade vi
virtuella servrar, virtuella maskiner--tillfälliga maskiner, som hjälpte oss
att bearbeta alla data parallellt.I stället för att bearbeta
ett dokument i taget--är det som om vi hade 35 robotar
som bearbetar var sitt dokument.Alla arbetar tillsammans, så när de är
klara samlas resultaten på ett ställe.Enkel matematik. Med 35 maskiner tar
det inte ett år, utan bara några veckor.Segern är vår.
Det tog lite mer än elva dagar
att bearbeta alla Panamadokument--eftersom det alltid
dyker upp problem på vägen:Maskinen förstår inte vissa filformat...
...det finns buggar i programvaran,
maskinerna fungerar inte hela tiden...Det finns alltid problem,
men med en armé med servrar--som arbetar
med alla de här dokumenten parallellt--kan vi göra det här mycket snabbare.
När vi hade bearbetat alla dokument-
-lät vi maskinen bygga ett index.
Vi använde... Vi försöker använda
program med öppen källkod hos ICIJ.Vi tror att... Den första frågan vi
ställer är vilka slags dokument vi har--och vilket som är det bästa verktyget
för att arbeta med de dokumenten--från runt om i världen. Sen ser vi om
det finns program med öppen källkod--som kan hjälpa oss med det.
Annars får vi köpa en mjukvarulicens.Vi vill använda program med öppen
källkod av flera anledningar.En är kostnaden. Jag sa inte det,
men ICIJ är en ideell organisation.Vi är inte rika. Vår budget är på mellan
en och en och en halv miljon dollar.De av er som sysslar med siffror
inser att det inte är särskilt mycket.Vi har inte råd att köpa
mjukvarulicenser för tusentals dollar.Det skulle bli en kostnad
som vi inte vill ha.Dessutom är program
med öppen källkod bra--för om man hittar ett verktyg
som man gillar, som Apache Solr--men det finns nåt som inte passar en,
av nån anledning--för att man behöver nåt annat,
kan en utvecklare förbättra det.Program med öppen källkod är bra
för att vi kan ändra dem för våra behov.Vi använde Apache Solr, som är ett
program som ser inuti dokumenten--och indexerar dem
och skapar ett sökbart index.Vi använd ett annat program med
öppen källkod som heter Blacklight--som är ett användargränssnitt
som låter oss söka i alla dokument.Det ser ut så här.
Blacklight är vår sökplattform--och det är ganska lätt att använda.
Det är inte svårt att lära sig.Längst upp till vänster finns en sökruta
och under den får man upp sökresultat.Till vänster kan man sen
filtrera sina resultat på olika sätt--på till exempel
år eller typ av dokument.Alla de filter som ni ser till vänster
går att justera.Man kan filtrera på vad man vill,
för att kunna få bättre sökresultat.Med den här plattformen kan vi hjälpa
båda våra två typer av användare.Å ena sidan har vi de bästa
undersökande journalisterna i världen.Vi har folk som har sysslat med
undersökande journalistik i tiotals år--och som har
de bästa källorna i sina länder--och som är jättebra på
att prata med folk och se på dokument--och få ur folk information
som ingen annan kan.Men de är inte alltid tekniskt kunniga,
och kanske rädda för tekniken.Google är så långt de kommer.
Det är det de är vana vid.Å andra sidan har vi
väldigt tekniskt kunniga människor--som Helena, som är medlem av ICIJ.
Hon är datareporter. Hon kan
programmera och göra svåra saker--och en sökmotor
utgör inget mysterium för henne.Vi måste välja verktyg som går att
använda av båda dessa ytterligheter.Vi behöver nåt som är enkelt, men som
ändå går att göra komplexa saker med.I Solr kan man göra enkla sökningar.
Man kan söka efter ett namn - "Messi".Ni kanske vet
att fotbollsspelaren Lionel Messi--hade ett företag
med i Panamadokumenten.Man kan söka efter "Messi" och se
om det finns dokument om honom.Man kan också göra komplexa saker,
som här med Joaquín Guzmán Loera.Några av er kanske känner igen
namnet "El Chapo Guzmán"."El Chapo" heter egentligen
Joaquín Guzmán Loera.Ett problem som vi hade
när vi sökte i dokument--var att stavningen
inte alltid är korrekt--särskilt om man har använt sig av
automatiskt textextrahering.Ibland kan inte maskinen läsa så bra
och saker blir felstavade, eller...I Spanien har vi många namn.
Jag blev presenterad som Mar Cabra--men mitt fullständiga namn är
María del Mar Cabra Valero.Man skulle aldrig hitta mig
utan att veta mitt fullständiga namn.Jag har parallella identiteter.
I USA fick jag heta Maria Valero.Mitt kreditkortsföretag bestämde det.
Det skulle bli svårt att spåra mig
utan mer avancerade söktekniker.En sak som jag tycker om
med Solr och den här plattformen--är att man göra sökningar
på närliggande begrepp:"Hitta alla dokument
med Joaquín Loera.""Det spelar ingen roll
i vilken ordning de två orden kommer"--"men de måste vara
inom två ord från varandra."Om det står nåt mellan Joaquìn
och Loera blir det också en träff.I det här fallet fick vi upp
"Joaquín Guzmán Loera".Det gör att vi kan ställa
mer komplexa sökfrågor--och inte bara söka efter "Mar Cabra"-
-utan genom en avancerad sökning
kan man få upp alla träffar med mig.Det kallas närhetsmatchning.
Vi kan också söka
med hjälp av reguljära uttryck--som är uttryck som man använder...
Det är som tecken som man använder--för att hitta olika mönster,
som till exempel:"Sök efter alla dokument med tre ord
som ser ut så här, följt av nio tecken."Det är bra för att söka
pass och identitetsuppgifter--och för sökningar efter ett mönster,
som till exempel bankkontonummer.De följer ju ett mönster. Först är det
en kod och sen ett antal siffror.Det gör också att vi kan göra
mer komplexa sökningar.Så vi kan hjälpa både en journalist som
inte kan nåt om teknik, och Helena.Det som är bra med öppen källkod
är att vi kan bygga på programmen.En av de mest efterfrågade
funktionerna från våra reportrar var--att de inte vill skriva in alla namn,
utan söka efter en lista på namn.Man kanske vill veta om nån politiker
från ens land finns i dokumenten.Då byggde vi in en funktion
som tillåter massökningar--där reportern ger maskinen
en lista med namn--kanske alla politiker i ett visst land-
-antingen exakt eller med närliggande
träffar, som jag förklarade--kanske med vissa steg mellan två ord-
-och på några sekunder,
eller några minuter--kan maskinen säga att av de 100
namn den fick fanns 30 i dokumenten--och säga var de namnen finns.
Sen får man gå igenom namnen för att
se om det var en bra träff eller inte.Nån har sökt på Joaquín Loera, och
därför finns ett dokument om honom.Det fantastiska med öppen källkod är
att det tog ett par veckor att utveckla--men sen kunde vi stoppa in det
och ha allt på samma plattform.Läckan innehöll inte bara dokument,
utan även strukturerade data--i form av
Mossack Fonsecas interna databas.Det här företaget sysslar med
att skapa företag i skatteparadis--så som alla företag har de ägare,
de har aktieinnehavare, en adress--och de har även mellanhänder
som bankens advokatfirma--som har hand om
konton i de olika länderna.Som ni kan se är det här en graf
med saker som är sammanbundna.Trots att den här plattformen är bra
gjorde den inte riktigt allt vi ville.Vi försökte hitta ett öppet verktyg för
att visa grafer, men vi hittade inget--så därför använde vi Linkurious-
-som är licensbaserad programvara.
Vi kom överens med dem
om att få använda det till våra projekt.Linkurious fungerar så...
Vi använde enterprise-versionen.Vi fick programmet
och vi installerade det på våra servrar.Vi hade en SQL-databas
som bestod av en SQL-server--som vi byggde om till Neo4j,
som är ett format för grafer.Det var ganska enkelt
att omvandla data till Neo4j-formatet--och sen kopplade vi bara ihop allt
och kunde visualisera graferna.Då ser det ut så här. Det här är en
gammal version, men ni förstår tanken.Det här är en graf från Swiss Leaks-
-som visar en stor spansk bankir,
Santander Banks Emilio Botín--som hade en bank i Spanien, men
som också hade ett konto i Schweiz.Det är det vi ser här.
Jag sa att jag skulle visa listan
på de verktyg som vi använder.Det här är vår stack.
För extraktion ur ostrukturerad
textdata från dokumenten--skapade vi vår egen process för att
gå igenom dokument efter dokument--och se inuti dem med öppna verktyg,
som till exempel Tesseract för OCR.Vi gjorde hela processen tillgänglig
som öppen källkod på Github.Och här ser ni också de andra
programvarorna som jag nämnde.En sak som jag...
Plattformarna, innan jag glömmer...
Det här kan vara gamla uppgifter.Vi har runt fjorton miljoner dokument
i 20 olika format.Vi har över 500 användare
som är ganska aktiva.Vi har en programmerare på heltid,
som jobbar med förbättringar."Kan jag stoppa in en lista på politiker
och slippa göra 100 sökningar?"Därför behöver vi en programmerare.
Som jag sa är det mesta
programvara med öppen källkod.En sak som jag är stolt över
är att ICIJ inte bara är ett nätverk--utan en gemenskap,
där alla arbetar tillsammans.Hur skapar vi en gemenskap,
och hur får vi folk att samarbeta?Jo, vi har inte bara skapat verktyg
som gör att de kan göra jobbet själva--utan även en virtuell redaktion
där de kan visa vad de har hittat.Så här ser vår virtuella redaktion ut.
Det är återigen
baserat på öppen källkod.I princip är det som ett socialt
nätverk, ungefär som Facebook.Ni ser att där finns ett nyhetsflöde.
Man kan också ha
trådade konversationer--där man frågar nåt och nån svarar,
och allt samlas på samma ställe.Man kan dela länkar och filer-
-och längst upp i högra hörnet
finns en brevlåda--så man kan även chatta och prata
med folk med privata meddelanden.Det här bygger på en öppen
programvara som heter Oxwall--som skapades
som ett typiskt socialt nätverk.Det här är väldigt roligt.
När vi började skräddarsy det här--var en av frågorna när man
registrerar sig som ny användare:"Är du intresserad av
män eller kvinnor?"Vi tog så klart bort det.
Det var förvirrande för reportrarna.Tack vare ett stipendium
från Knight Foundation--kunde vi bygga på
ett antal säkerhetsfunktioner--och vi kallar det för Global I-HUB.
Den mest synliga säkerhetsfunktionen
är tvåstegsautenticering vid inloggning.Det här är inloggningssidan,
där man skriver in användarnamn--och sin lösenfras,
som är som ett långt lösenord.Man behöver även sin mobil-
-och en app som heter
Google Authenticator installerad--som genererar en slumpmässig kod
var 30:e sekund--som man måste skriva in där.
Då kan man se att det är rätt person.Folk kan förstås stjäla både ens dator
och mobil, men det är mer komplicerat.Google Authenticator ser ut så här.
Det är en mobilapp--som genererar en kod
som man skriver in.Några siffror om vår gemenskap.
Några av de här siffrorna är gamla.Jag har inte haft tid att uppdatera dem
med de allra senaste siffrorna--men vi har över 600 användare.
De här siffrorna är från oktober,
de här senaste siffrorna.Vi har 21 000 delade tillfällen,
1 500 forumposter med många inlägg--och över 600 uppladdade filer-
-och då menar jag de dokument
som reportrar arbetar med--alltså domstolsprotokoll,
offentliga handlingar--och läckor som inte ingår i
de stora läckor som vi arbetar med.Nästa steg... En sak som vi
skulle vilja göra i nästa projekt--är att försöka göra
entitetsextraktion i dokumenten.Det innebär att vi vill
att maskinen ska kunna säga:"Det här är de namn på företag och
människor som finns i dokumentet."Än så länge
kan vi inte göra det särskilt bra.Vi försöker förbättra det,
för det vore väldigt bra.En annan sak som vi vill är att få data
att kommunicera. Vad betyder det?I början av mitt föredrag sa jag
att vi arbetade med fyra olika läckorVarje läcka har en egen plattform, och
de kommunicerar inte med varandra.Just nu hittar vi många länkar
mellan HSBC i Swiss Leaks--och Mossack Fonseca,
som samarbetar--men man kan ännu inte söka
i båda dokumentsamlingarna samtidigt.Nästa steg är att skapa
ICIJ Knowledge Center--där vi kan samla alla läckor,
alla offentliga databaser--och alla dokument från andra projekt,
som offentliga Världsbanksdokument.Vi vill göra allt det sökbart.
Vi vill också skapa nåt slags
affärsmodell kring det--för att se om de vi samarbetar med
kan bidra, främst till serverdriften.Det finns en stor kostnad här,
och det är inte programmeraren--utan den stora kostnaden
är servrarna.Vi behöver många servrar
och avancerade servrar--så vi funderar på
hur vi kan skapa en affärsmodell--som kan hjälpa oss bibehålla projektet.
Den stora utmaningen är inte bara
att samla all den kunskap som vi har--utan även att få våra reportrars olika
data att kommunicera med varandra.Till exempel har vi
många olika slags data hos ICIJ--det finns en databas
över sanktioner i USA--och sen har vi en lista med indiska
politiker från vår indiska reporter--och en med argentinska bedragare
från vår argentinska reporter.Jag vill att alla de dokument-
samlingarna ska kunna kommunicera.Vi håller på att jobba på ett verktyg
som ska hjälpa oss med det.Jag vill öppna för frågor-
-men jag vill inte sluta
utan att prata om kryptering.Ni som är här på en konferens
för undersökande journalister--måste använda kryptering.
Det har besparat oss många problem-
-och det har gjort att vi kan tala fritt
inom vår egen organisation.Om ni inte använder kryptering
borde ni börja med det.Snowden ska ju prata här senare-
-och han tar säkert upp vikten av
kryptering för att kommunicera säkert.En av anledningarna att han läckte
just till Greenwald och Poitras--var att de använde kryptering.
Hur många av er har PGP?
Ni som inte räckte upp händerna
borde skaffa det i kväll--eller så snart som möjligt.
Det är inte särskilt komplicerat.Det finns andra verktyg
för krypterad kommunikation.Det har varit väldigt viktigt för oss.
Det här är några kommersiella
program. Alla har sina problem.Med kommersiella program
ger man sina data till nån annan--så därför har jag med en genomgång
av verktyg, som jag twittrar senare--så att ni kan få länkarna.
Det är några verktyg,
men om ni bara vill göra en sak--borde ni skaffa en PGP-nyckel,
som kan se ut ungefär så här--och som gör
att ni kan kommunicera krypterat.Man måste också installera
en nyckelhanterare, eller ännu hellre...Det här har blivit så enkelt.
Om man installerar Mailvelope--som är ett webbläsartillägg
för Firefox eller Chrome--så kan man använda kryptering
med Gmail på ett väldigt smidigt sätt--utan att behöva nån IT-människa
som hjälper till med lösenord och sånt.Man installerar webbläsartillägget-
-skapar en nyckel inifrån Mailvelope,
och sen kommunicerar man krypterat.Jag vill lämna lite tid för frågor.
Här uppe står mina kontaktdetaljer.Nu vill jag höra vad ni har att säga.
Tack.Frågor?
Ja, hej.
Hur kunde ni lita på sökresultaten när
ni inte visste vad databasen innehöll?-Hur menar du?
-Ni gjorde det möjligt att söka.Hur vet ni att ni kan
lita på sökresultaten?Menar du
"Hur vet jag att tekniken fungerar?"--eller
"Hur vet jag att dokumenten är äkta?"-Nej, tekniken.
-Att indexera är ingen vetenskap.Att indexera är komplicerat, men vi
skapar ingenting i sökplattformen.Den fungerar i princip som Google.
Google tittar i webbsidor och extraherar
texten och stoppar den i en sökmotor.Det är samma sak som Blacklight gör.
Den tittar i dokumenten och säger "Mar
Cabra finns på sidan 1, 7 och 2 000."Sen presenterar den sökresultaten.
Den fungerar i princip som Google.Det är aldrig en fråga om tillit.
Man måste i och för sig tänka på en
sak när man gör teckenigenkänning--nämligen att det kommer att finnas fel.
I Luxemburgdokumenten är suffixet
för företag i Luxemburg SARL--men A:et har en grav accent.
Det gick inte så bra.
Ibland tolkades L:et som en etta.Därför måste man ibland... Man vill
hitta rätt även med fel stavning.Det är nog det enda.
Allt annat sköts automatiskt.Ni såg det säkert inte, men det finns en
knapp för att förhandsgranska texten--och en för att ladda ner dokumentet.
Det blir som med Google.Man kan få träffar som inte är viktiga,
men det ser man när man tittar efter.Vad tänker du om att göra
dokumenten offentligt sökbara?Kommer det hända? Vad skulle
ni behöva för att kunna göra det?ICIJ kommer inte att publicera
11,5 miljoner dokument.I dokumenten finns... Vi vet inte vad
som finns i 11,5 miljoner dokument.Vi har hittat passuppgifter, bankkonton
och namn som måste skyddas--så därför vill vi inte publicera de
fullständiga dokumenten av etiska skäl.Vi vill inte heller ge dokumenten till
några polis- eller skattemyndigheter.Också av etiska skäl.
Vi är journalister, vi är inte poliser.Vi tror däremot
att det finns ett stort värde--i att göra strukturerade data
tillgängliga online--det vill säga
Mossack Fonsecas interna databas--med företag i skatteparadis
och vem som äger dem.Skatteparadis bygger på
att deras företagsregister är hemliga.Många experter, från Världsbanken
och från olika länder--säger att företagsregister
i skatteparadis borde vara offentliga--och att där borde stå verkliga ägare
och aktieägare, oavsett land.Vi tänker publicera de namnen-
-och databasen med över
200 000 företag och deras ägare.Det publiceras
på vår webbsida i början av maj.Vi har redan gjort det
med Offshore Leaks och här är...Här är... Just nu...
Offshoreleaks...
Förlåt...
Webbsidan heter offshoreleaks.icij.org.
Vi har redan de strukturerade data...
Titta. Där står det att det kommer mer--och att man ska
prenumerera på vårt nyhetsbrev.Det här är den databas
där man kan söka i Offshore Leaks.Här ska vi lägga in de över 200 000
företagen från Mossack Fonseca.Det blir sökbart.
Det här är en sökmotor som...Jag skriver in ett namn
på nån i Spanien, som jag känner till...Man kan söka och man kan se grafer
och utforska data.Man kan också ladda ner alla data.
Vi kommer att ha en förbättrad version.Vi ska göra en version med Offshore
Leaks och med Panamadokumenten.Det kommer i början av maj.
Prenumerera på vårt nyhetsbrev.-Har vi tid för en fråga till?
-En till.Vad har ni varit med om för attacker
på er programvara och era system?Vad då? Attacker?
Folk som på olika vis
försöker stänga ner era system.Har ni kommit på vem det var?
Vi övervakar all trafik som vi får.
Bakom allt det här
har vi också en analysplattform--som gör att vi kan se vad folk gör.
Jag tar i trä, men...
Under det år som undersökningen
var hemlig fick vi inga attacker.Just nu befinner vi oss
i ett annat läge. Alla känner till oss.Jag står här och berättar
vad plattformarna heter--och vad vi använder för programvara...
Vissa reportrar pratar också om det
och vi finns i strålkastarljuset nu.Just nu... Än så länge har vi inte
blivit hackade eller drabbats--av överbelastnings-
eller brute force-attacker.Vi har gjort allt vi kan för att se till
att folk inte kan knäcka våra lösenord.Än så länge har ingen lyckats,
men det ser annorlunda ut nu.Vi står i strålkastarljuset
och folk kommer att vilja hacka oss.Det har de sagt, i alla fall.
Men än så länge har inget hänt.Det otroliga är att 400 reportrar
har kunnat låta bli att avslöja nånting--förrän nu, när jag tror
att det var Eva som ställde frågan.Det är inget personligt, men vår danska
kollega publicerade webbadressen--som alla hade lovat att hålla hemlig,
så då fick ni ändra på en massa saker.Folk gör alltid misstag. Det största
misstaget är inte krypteringen--utan det är alltid
nån bakom tangentbordet.Nån som inte tänker efter. Man kan ha
otroligt bra och stark kryptering--men om ens lösenord är namnet
på ens katt är man inte så skyddad.Jag vill avsluta med det. Jag finns här
sen om ni vill ställa fler frågor.Det här projektet har fått mig att
tro... Vi har inte tid med fler frågor.Det här projektet
har fått mig att tro på mänskligheten.Det får mig att tro på mänskligheten
och på mina kollegor--och på journalistiken, men visst är
vår svagaste länk våra journalister.Det här är nåt som alla
som sysslar med säkerhet alltid säger.Oavsett hur många säkerhetsåtgärder
man använder sig av--är användaren den svagaste länken.
Men förhoppningsvis
blir det inga tråkiga nyheter--utan såna som får premiärministrar att
avgå, som på Island. Tack så mycket.Översättning: Peeter S. Randsalu
www.btistudios.com
Skapa klipp
Klippets starttid
Ange tiden som sekunder, mm:ss eller hh:mm:ss.Klippets sluttid
Ange tiden som sekunder, mm:ss eller hh:mm:ss.Sluttiden behöver vara efter starttiden.Att gräva fram Panamadokumenten
- Produktionsår:
- Längd:
- Tillgängligt till:
Mar Cabra är chef för Data & Research vid International Consortium of Investigative Journalists (ICIJ) som utvecklar hjälpmedel för grävande journalistik. Här visar hon de tekniska verktyg och applikationer som användes i grävandet av den största läckan i vår tid, Panamadokumenten. Mar Cabra berättar om utmaningarna som undersökningen stod inför, som exempelvis att bearbeta 11 miljoner dokument. Avslöjandet var en journalistisk undersökning i största hemlighet. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Ämnen:
- Information och media
- Ämnesord:
- Massmedia, Publicistik, Tidningar, Tidskrifter, Undersökande journalistik
- Utbildningsnivå:
- Högskola
Alla program i UR Samtiden - Gräv 2016

- Spelbarhet:
- UR Skola
- Längd:
Att gräva fram Panamadokumenten
Mar Cabra är chef för Data & Research vid International Consortium of Investigative Journalists (ICIJ) som utvecklar hjälpmedel för grävande journalistik. Här visar hon de tekniska verktyg och applikationer som användes i grävandet av den största läckan i vår tid, Panamadokumenten. Mar Cabra berättar om utmaningarna som undersökningen stod inför, som exempelvis att bearbeta 11 miljoner dokument. Avslöjandet var en journalistisk undersökning i största hemlighet. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Skola
- Längd:
Grävande samarbete i Panamadokumenten
370 journalister från 78 länder arbetade tillsammans i över åtta månader för att granska 11 miljoner dokument som kom att heta Panamadokumenten. I en värld där pengar, företag och personer är verksamma globalt måste även undersökande journalister vara det. Här berättar några framstående journalister i denna undersökning om hur arbetet gick till. Medverkande: Mar Cabra, Helena Bengtsson, Joachim Dyfvermark och Johannes Kristjansson. Moderator: Fredrik Laurin. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Skola
- Längd:
Gå inte i nyhetsfällan
Med konkreta exempel och handfasta tips förklarar Mattias Göransson, chefredaktör för magasinet Filter, varför den berättande journalistiken är nyhetsjournalistikens motsats, och vilka dramaturgiska lärdomar man kan dra av såväl de gamla grekerna som manusförfattarna i Hollywood. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Access
- Längd:
Om stjärnkirurgen
Samtal om SVT:s granskning av kirurgen Paolo Macchiarini mellan Bosse Lindquist, producent, och Anna Nordbeck, researcher på Dokument inifrån vid SVT. En av grundförutsättningarna för att lyckas med granskningen var att Bosse Lindquist och Anna Nordbeck lyckades bygga upp ett förtroende hos Paolo Macchiarini. Men hur gör man för att komma nära den man granskar och hur långt kan man gå för att få fram sanningen? Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Skola
- Längd:
Så kan fördjupande journalistik lyftas digitalt
Anna Careborg och Mark Malmström på Svenska Dagbladet visar konkreta förslag på digitala verktyg som även redaktioner med små resurser kan använda för att få den fördjupande journalistiken att lyfta. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Skola
- Längd:
Så tar du fajten om insyn
Hur hanterar man beskedet att en konsultrapport är "internt arbetsmaterial" eller vetskapen om att en myndighet varnar sina entreprenörer för "snokande journalister" som begär ut handlingar? Mats Amnell är rådgivare hos Offentlighetsjouren vid Fojo och berättar och ger tips om hur man får motsträviga myndigheter att leva upp till offentlighetsprincipen. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Skola
- Längd:
Sju år med dödade kvinnor
Kerstin Weigl är journalist på Aftonbladet. Här berättar hon om arbetet med att kartlägga de kvinnor i Sverige som under 2000-talet dödats av en man de haft en kärleksrelation med, och vad som hände med de dödade kvinnornas barn. Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Skola
- Längd:
Livet efter Excel
Helena Bengtsson, datajournalist på The Guardian, guidar genom de metoder och verktyg som väntar härnäst efter att man lärt sig grunderna inom datajournalistiken. Hur ska man tänka när man använder relationsdatabaser och programmering? När ska man försöka själv och när ska man låta en expert lösa problemet? Inspelat den 9 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Skola
- Längd:
Avslöja missförhållanden med datajournalistik
Kristoffer Örstadius, datajournalist på Dagens Nyheter, ger konkreta exempel på hur man kan få fram information med hjälp av algoritmer och sökrobotar. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Access
- Längd:
Så lägger du upp ett grävprojekt
Under år 2015 gjorde Kaliber i Sveriges Radio 40 granskningar. Annika H Eriksson, producent, och Andreas Lindahl, exekutiv producent, för Kaliber berättar om sina metoder för att gräva effektivt och noggrant, från idé till publicering. De ger handfasta tips om hur arbetsledare kan lägga upp ett grävprojekt. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Skola
- Längd:
Gräv bland fakturorna
All offentlig verksamhet går att följa och granska och där hittar du fakturorna som gör att du kan ställa makthavare till svars för hur verksamheten sköts och hur skattebetalarnas pengar används. Journalisten Malin Crona berättar hur du konkret går till väga och ger praktiska tips på hur man ställer de rätta frågorna utan att vara expert i ekonomi. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Skola
- Längd:
Så granskar du politikern, brottslingen, företagaren
Linda Larsson Kakuli är researcher på SVT och ger tips på hur du snabbt kan hitta information om en person. Det kan handla om ett nytt kommunalråd, en misstänkt för ett uppmärksammat brott eller någon som etablerar ett företag. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Access
- Längd:
Hur granskar vi utsatta grupper?
Att lyfta fram problem bland tiggare och flyktingar resulterar ofta i kommentarer som att man flirtar med främlingsfientliga krafter. Hur hanterar man som grävare det faktum att ens reportage riskerar att spä på fördomar och hat? Diskussion med Sara Recabarren, Kalla fakta och Lina Makboul, Uppdrag granskning. Moderator: Terje Carlsson. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola

- Spelbarhet:
- UR Skola
- Längd:
Hur du får folk att berätta
Katarina Gunnarsson, prisbelönt reporter på Sveriges Radio, ger tips om hur man som journalist får intervjupersoner att öppna sig och hur man skapar trygghet så att folk börjar berätta i starka scener och bilder. Inspelat den 8 april 2016 på Svenska mässan, Göteborg. Arrangör: Föreningen grävande journalister.
- Produktionsår:
- 2016
- Utbildningsnivå:
- Högskola