Jorge Caldeira, escritor, doutor em Ciência Política, mestre em Sociologia e bacharel em Ciências Sociais pela Faculdade de Filosofia, Letras e Ciências Humanas da Universidade de São Paulo, se encontrou, na Rua Líbero Badaró, no centro de São Paulo, com Alexandre Villares para conversar. Alexandre é arquiteto e urbanista por formação, pesquisa o ensino de programação em um contexto visual e trabalha como professor e educador de tecnologias e artes em diversas instituições. Ele é integrante de arteprog – arte e programação e foi editor convidado da Revista Amarello #27.
Alexandre Villares: Essas questões de arquivar as coisas estão cada vez mais interessantes. Tenho um amigo programador que foi estudar Biblioteconomia depois de mais velho, e ele fala que tem um problema, por exemplo, imaginem que o pessoal da saúde tivesse um funcionário chamado hospitalecário. Isso não funciona, porque teria o hospitalecário da administração, o hospitalecário… Mas a Biblioteconomia ficou com esse nome. O cara é um bibliotecário. Mas dentro da Biblioteconomia você tem todo um universo de especialidades e de discussões, como na saúde você tem as especialidades e tal…
JC: E arquivo tem também: se chama Arquivologia e o cara se chama arquivista. A diferença da biblioteca e de um arquivo é que na biblioteca você sabe o que tem em cada unidade, cada livro é uma unidade; no arquivo, não necessariamente. Às vezes, tem um monte de caixas e você cria as unidades do que está guardado, dependendo do tipo de material, de onde veio, etc. E existe toda uma ciência para fazer isso. E os arquivos existentes, eu uso muito – comecei a usar, como historiador, estudando em arquivos. Era basicamente papel, mapa e coisas do gênero. Então as classificações básicas tinham sido criadas para isso. Quando veio a imagem em movimento, o cinema, você quer arquivar um filme, mas o filme tem um timetable, que é descrito minuto a minuto. Já é uma coisa bem mais complicada de fazer. Para você saber o que foi guardado num vídeo, no arquivo de uma emissora de TV, a cada minuto, era complicado há vinte anos. Ainda assim, tudo tinha uma base física. A internet e a programação eletrônica criaram uma coisa difícil, porque não existe um original como havia o máster da fita que faz o disco, o negativo da foto, quando se usava negativo, e até mesmo o papel. E você não tem um testemunho confiável que liga aquele documento a alguma coisa, um fato. Isso quer dizer que, quando você pega uma certidão de nascimento, um papel, ela foi escrita para dizer que fulano nasceu naquele dia, então o papel liga um evento a uma pessoa de uma determinada maneira. Na eletrônica, é difícil, porque você até consegue guardar um e-mail, mas ele pode sumir facilmente na nuvem; a linguagem de programação muda, e começa a complicar. Mesmo as citações acadêmicas online que dizem “visto no dia tal em tal site”, você imprime aquilo para certificar, mas é uma certidão que não certifica nada.
Então você tem uma desmemória na eletrônica, ou uma desclassificação – no sentido de classificado, de arquivado, que não existe no eletrônico. Pelo menos não se sabe ainda como que isso vai ser feito.
AV: O pessoal está tateando. Eu vejo os bibliotecários com o problema de guardar obras de arte digitais e os suportes mudarem, quer dizer, o equipamento que rodava aquele programa que fazia funcionar a obra não tem mais manutenção. Então vários programas que sabiam ler aqueles arquivos não existem mais. Como é que você faz? Você consegue emular o programa, existe o archive.org, que fizeram um trabalho incrível. Um emulador de hardware que você pode emular computadores antigos que rodam os softwares que eles guardaram. Já é uma tentativa.
E eles tentam também guardar páginas de internet antigas, então, se um site sai do ar, você tem o que se chama wayback machine. Se eles guardaram aquela página, você consegue consultar mesmo que ela não exista mais. Muitos jornalistas usam isso em certas investigações. Você vai lá e vê como era a página do cara naquela época na data tal ou num período próximo. E quanto ao que você estava falando, dessa questão da ligação do fato a um documento, existe a ideia da assinatura criptográfica hoje em dia, que talvez, com o avanço dos documentos assinados digitalmente, você consiga pelo menos estabelecer que, em certo momento, alguém assinou aquele documento. Foi assim que resolveram, por exemplo, a questão da nota fiscal eletrônica. Todas as notas fiscais eletrônicas são assinadas criptograficamente, o que garante a integridade de cada uma, que ninguém vai forjar, mudar o valor da nota e as informações contidas nela. Então, talvez, para o futuro, se tivermos mais assinaturas criptográficas, ou pelo menos em algumas classes de documento, vamos conseguir ter alguma noção melhor da integridade documental digital.
JC: Lentamente, está se tentando criar um arquivo. O equivalente do arquivo físico. O arquivo físico é uma invenção do século XVII, XVIII. O primeiro arquivo foi o arquivo das Índias – o primeiro grande arquivo que guardou toda a documentação de toda a América espanhola. Ele fica em Sevilha. Eu não sei nem se ainda está aberto. Eu cheguei a pesquisar nele ainda no papel, nos originais. E eles fizeram algo que era uma criptografia simplérrima: cada sala tinha um nome, Buenos Aires 1, Buenos Aires 2, que é a documentação vinda de lá, e o armário, a prateleira e a caixa.
AV: Codificação da localização.
JC: Dessa maneira, eles guardaram bilhões de documentos, com uma chave de classificação muito simples. E a ideia era o quê? Era ter isso que você falou: alguma coisa que comprovasse uma coisa única, por exemplo, o juiz da cidade de Buenos Aires condenou aquele cara naquele dia tal, e aquele atestado ficava lá e era usado para os fins que o governo quisesse, vamos dizer assim, e depois virava um arquivo público, que todos podiam ver. Agora está tudo digitalizado, mas tinha o original que garantia autenticidade. Ao se recriar isso na internet, se repõe a possibilidade de fazer um arquivo. Quer dizer, na verdade, o que está na eletrônica não tem memória e, além disso, o dado eletrônico é perecível – uma folha de papel ruim dura 500, 300 anos, papel jornal dura 150, 200 anos.
AV: Arquivista gosta de papel. Papel dura.
JC: Sim, por exemplo, meus arquivos eletrônicos, para manter vivos eletronicamente, eu tenho que trocar o software regularmente, a cada dois anos.
AV: O CD, que a gente achou que ia ser uma mídia ótima de arquivística, é um lixo. Dez anos passam, e dá mil problemas.
JC: Mas é um rolo esse negócio. Porque, além de você ter essa coisa de criar a originalidade do documento e comprovar que aquilo é o original, ele tem que ser mantido íntegro, e manter íntegro na rede é um trabalho de Sísifo. Todo dia está morrendo uma linguagem de programação, algum formato, e os programas não abrem mais aquilo que antes abriam. Existiam programas extraordinários, mas, se o computador não roda mais o programa, você perde seus documentos.
AV: Nesse sentido, o software livre tem um pouco de vantagem. Por exemplo, eu usava o Freehand para ilustração editorial. A Adobe comprou a Macromedia por causa do Flash e matou o Freehand, porque queria vender o Illustrator. Os materiais que eu tinha do tempo de faculdade não abrem mais, porque o programa não roda nos computadores de hoje. Então, agora, a chance de resgatá-los é rodar um emulador de um Mac antigo para tentar rodar um Freehand velho e tentar abrir, para salvar em EPS. É importante pensar nessa questão dos formatos abertos. O software livre e os formatos abertos dão uma sobrevida a isso, porque o código que gerou o formato pode ser inspecionado, pode ser traduzido por alguém.
JC: Sim, mas ainda está muito longe de ser parecido com o que era o tratamento com documentação histórica num arquivo clássico. Falta mais ou menos tudo. É muito aquém. Como tenho muita documentação histórica arquivada, que usei para minhas pesquisas, tive que criar um programa de arquivologia que simula a ficha de um arquivo para linkar a esse programa.
AV: Você trabalhou com vocabulário controlado, com thesaurus? Como você faz a organização no seu arquivo?
JC: Não. Na verdade, vocabulário controlado e thesaurus são muito complicados de fazer, mesmo em arquivo. Porque você só pode fazer vocabulário controlado depois que você tem tudo classificado de alguma forma, não antes. O vocabulário controlado é o que você está fazendo em processo, enquanto você está entendendo o material já organizado.
Eu tenho praticamente toda a História do Brasil arquivada em documentos. Sei lá, umas 3 milhões de páginas de documentos históricos. A Biblioteca Nacional, por exemplo, tem 9 milhões na sessão de manuscritos. É bastante documentação. Cobre tudo. Desde as primeiras notícias do Brasil até coisas recentes, tiradas de vários lugares, vindas de várias fontes. Por isso, pesquisar nesse arquivo é algo complicado. Na verdade, acho que só eu mesmo hoje em dia consigo pesquisar nele, porque eu sei mais ou menos a história de tudo que está lá.
AV: Qual é o seu próximo projeto? O que vai envolver de pesquisa?
JC: Eu gostei do mundo digital muito cedo. Fiz um CD-ROM de História do Brasil em 1995, que era CD-ROM associado a site. A World Wide Web é de 1993. Mas, naquela época, eu já percebi que aquilo não era estável. Agora, acho que está começando a estabilizar. Está começando a deixar de ser, como eu dizia, empresas eviscerando, pedaços de coisas. E, enfim, não tem muito mais passado, vamos dizer assim, para eviscerar. Agora, eles vão ter que reconstruir. Por exemplo, o streaming já é a principal fonte de receita da indústria fonográfica. As pessoas agora estão começando a pagar pelo conteúdo – o que antes não faziam, porque pirateavam tudo. A Netflix está começando a produzir, quer dizer, está virando um estúdio. Antes, o cara da internet só passava para frente o conteúdo dos outros. Não produzia seu próprio, nem pagava para produzir.
Falei tudo isso porque, se isso se estabilizar, eu vou fazer tudo na internet, não mais em papel. Embora eu goste muito de escrever livro em papel, a rede estando mais estável torna-se um ambiente interessante para fazer as coisas diretamente dentro dela.
AV: Ah, tem uma noção que as pessoas têm da nuvem, que nada mais é que você colocar suas coisas no computador dos outros. É um jeito meio bobo de falar do computador dos outros, e aí o grau de confiança que você tem depende do grau de confiança que você tem nessas empresas e instituições. Quer dizer, quando colocamos um material na internet, precisamos pensar um pouco sobre a permanência dessas instituições. Não se sabe se daqui cem anos o Google vai existir, se a Amazon, que vende muito espaço de armazenagem, vai existir. Eu espero que, por exemplo, o pessoal do archive.org tenha permanência, porque eles fazem um trabalho importante.
JC: Ao mesmo tempo, o que orginalmente era aberto e colaborativo na rede ainda é o que anda, é o que sustenta ela, a base. As grandes empresas que estão sendo montadas flutuam em cima dessa base. Elas conseguiram achar nichos que dão muito dinheiro e conseguem vender informação classificada por um bom preço, quer dizer, o Google vende a informação de quem faz pesquisa para quem não sabe e está do outro lado querendo anunciar. Essa é a mercadoria dele. Então alguns conseguem fazer isso como mercadoria. Mas a rede ainda está pouco organizada como mercado, ainda é muito faroeste, selvagem.
AV: Agora, um ponto muito legal que você levantou é essa questão da colaboração, do crowdsourcing, que é essa capacidade que a rede traz para as pessoas colaborarem para criar recursos.
JC: Mas, na verdade, se o cara tem capacidade técnica, ele deveria receber. Uma das razões pelas quais eu não faço coisas na rede é que eu não sou rico para trabalhar de graça. Preciso ganhar a vida [risos].
AV: Mas existem mecanismos. Por exemplo, o pessoal do software livre encontrou mecanismos de remunerar o trabalho. O produto final é compartilhado livremente, mas você garante o ganha-pão de quem está produzindo.
Isso acontece de muitas maneiras. Tem pessoas que trabalham em empresas que se beneficiam de software livre, aí elas locam aquele funcionário para integrar ou parcialmente contribuir para a comunidade de software livre. Então o cara ganha para fazer o trabalho dele, mas o trabalho dele tem um impacto num software livre que, por sua vez, beneficia a empresa. A própria fundação Mozilla, que faz o Firefox, consegue doações e tem funcionários pagos fazendo o serviço deles. Então tem vários jeitos de se organizar. Uma ferramenta de programação que eu uso muito, voltada para as artes visuais, chamada Processing, é tocada hoje por uma fundação. E aí as pessoas que usam fazem doações – eu mesmo ponho muito pouco lá de doação, mas, como é uma ferramenta que eu uso, eu colaboro. E eles também conseguem doações de instituições que veem sentido nessa ferramenta. Então existem maneiras. Eu não sou muito especialista na questão de financiamento de software livre, mas eu posso dizer que é um ecossistema que tem crescido, então economicamente é possível.
JC: Meu primeiro trabalho foi fazendo enciclopédia físicas… Abacaxi, ábaco, abacate… até Z. Fazer isso profissionalmente é um negócio muito complicado. Porque uma enciclopédia é um conjunto de especialistas e um conjunto de pessoas com capacidade de divulgar o que os especialistas conhecem. Então eu escrevia o verbete de Física, e existia um físico que dizia “isso aqui é bom”, “isso aqui não é”, “isso aqui está certo”… Eu não entendia de Física e escrevia sobre Física, e isso só era possível porque tinha um físico que avalizava tudo. Iniciativas abertas como Wikipédia supõem que você, só porque tem a boa vontade de escrever, faz sem o físico. Não faz.
AV: Mas você pressupõe também que o físico vai olhar e falar “ah, isso aqui está errado” e vai corrigir.
JC: Supõe. Não aparece. Nenhum físico vai fazer isso.
AV: O Wikipédia é polêmico. Algumas validações foram feitas com especialistas, e dizem que a taxa de erros não é tão alta assim.
JC: Se você pegar um verbete “Coca-Cola”, não vai ter crítica à Coca-Cola.
AV: Alguns verbetes são polêmicos. Existe uma guerra de edição. Eles tentam evitar muito as polêmicas através de uma política do ponto de vista neutro.
JC: A certificação é baixa, porque acaba sendo um consenso meio sem pé nem cabeça. Se você pega um país como a França e lê o verbete de História da França, você não entende. Alguém escreve, outro edita, e vira uma maçaroca, e não uma coisa simples, sintética.
AV: Não tem um crivo, mas existem algumas regras – por exemplo, para estar na Wikipédia, precisa ter uma relação com um documento fora da Wikipédia. Você só pode mencionar uma coisa que foi citada numa outra obra publicada.
JC: Por isso que a enciclopédia antiga funcionava, porque era um cara que fazia isso. Na famosa enciclopédia Britannica de 1911, deram a filosofia para o Wittgenstein, e tudo que era relacionado. Aí a coisa toma rumo. Esse tipo de coisa ainda é muito difícil de conseguir dentro da rede. A rede tem muita opinião e pouca autoridade, ou nenhuma autoridade – o que é bom para a diversidade, mas não é bom para guiar.
AV: Agora está tendo outra guerra complicada, que é a guerra dos publishers das revistas científicas. Está vindo um movimento de open science e da publicação de artigos revisados por pares fora dos sistemas dos grandes publishers. Várias universidades na Alemanha resolveram parar de pagar a Elsevier (a maior editora de literatura médica e científica do mundo) e mudar a negociação de certos journals. Podem contar que nos próximos dez anos vai ter uma grande mudança a respeito disso.
JC: É, vai, mas isso, enfim, é rearrumar a autoridade na área. A autoridade de curador.
AV: E os fluxos de dinheiro e de funcionamento também.
JC: Sim, mas os fluxos seguem o que tem autoridade. Ninguém faz fluxo de dinheiro para onde não há autoridade.
AV: Mas eu acho que o Elsevier, no fundo, não tem autoridade. É aí que está. A autoridade está nos autores, não nesses intermediários. Eu acho que é por isso que eles vão morrer.
JC: Não é assim. Um dos problemas centrais da rede é o seguinte. Quando eu comecei a trabalhar em mídia, quarenta anos atrás, a autoridade da mídia vinha do fato de que muito pouca coisa passava pela máquina de imprimir. Para você fazer a revista Veja, existia uma máquina gigantesca que imprimia 400 mil vezes em três horas e ninguém mais conseguia fazer uma coisa naquela velocidade e espalhar tão depressa. Então, o cara que aparecia noticiado lá, aparecia como notícia para muita gente, e era o único que emitia opinião a respeito de um assunto qualquer – um médico, um artista, um político, o que fosse, dependendo da seção da revista. Aí o entrevistado falava umas frases e ficava famoso no Brasil inteiro. Na internet, todo mundo é emissor e todo mundo é leitor. No Facebook, qualquer pessoa emite sua “honesta opinião” a respeito de qualquer assunto, em geral sem se saber se é verdadeiro ou falso, e as pessoas leem. A sensação de virar emissor é universal. OK. E fica a questão de que aquele grupo, que era um conjunto de grandes autoridades –
AV: O gatekeeper, né?
JC: Isso está desaparecendo na internet – ou melhor, virou o Google ou o algoritmo, que é uma autoridade fake. Qual era a função do cara que tinha o juízo de autoridade? Era apontar o dedo, dizer “esta ópera é boa”, aí todo mundo ia na ópera, ou “essa ópera é ruim”, e ninguém ia naquela ópera. Esse cara era um representante, não eleito, de uma opinião média. Esse poder de fazer isso está desaparecendo na internet. É um poder que está sub judice na internet. E se ele desaparecer, aí não vamos mais saber o que é besteira e o que não é.
AV: Mas você ainda tem os grandes influenciadores. Eles são escolhidos de uma maneira diferente.
JC: O grande influenciador não tem autoridade. O maior influenciador na internet se chama Whindersson Nunes. Essa é a grande autoridade que diz o que é bom e o que não é no Brasil hoje. Ele tem 15 milhões de seguidores, que é muito mais do que qualquer emissora de televisão tem, e ele é um ser humano comum, que não diz nada, e comprou um avião. Essa é a nova autoridade. O cara que morreu da Academia vai ser substituído não por uma coisa melhor, mas por alguém que representa a massa de gente que o país tem, a opinião média, e isso não quer dizer que essa pessoa tenha efetivamente autoridade em qualquer área – afora, no caso, a da comunicabilidade. Isso vem no bolo da internet, onde todo mundo emite e todo mundo consome. A internet é como se fosse todo mundo entrando na máquina da Veja e publicando suas palavras. O problema é: quem diz qual palavra presta? Esse problema não vai ser resolvido por consenso.