sexta-feira, 21 de junho de 2013

A privacidade acabou - Big Data X Privacidade

A privacidade acabou. Em 4 passos.

·         Passo 1: coleta e armazenamento de dados
Com esta onda de Big Data por aí, está todo mundo coletando dados sobre todos. A operadora de celular sabe por onde a gente anda e quando. Qual o caminho que costumamos fazer, por onde costumamos andar em cada dia da semana e horário. E se instalarmos aplicativos tipo o Waze no nosso celular, a Google (que comprou o Waze) vai saber até a que velocidade estamos andando. E daí inferir se estamos a pé ou de carro, ou num engarrafamento.
Aí alguém inventou a tecnologia de RFID, e ela está em cartões com chips, carros, produtos novos e vai estar em sacolas, carrinhos de supermercados, etc. Então não é só por celular. Os aplicativos e softwares que usamos em celulares, tablets, notebooks e etc também estão avisando onde estamos, se estivermos conectados via Wifi, 3G ou 4G.
A coleta também pode ser feita por observação. Não conheço estabelecimento que faça isto, mas é um futuro provável. Quando você paga em dinheiro num supermercado, este só registra o que você comprou e como; não ficam registrados dados como seu sexo, idade, etc. Mas imagine que o operador do caixa (check-out) possa observar o cliente e utilizar códigos para dar entrada no sistema de dados que ele está vendo (sexo, faixa etária, estilo de se vestir, se está acompanhado ou não).
Num futuro um pouco mais distante isto já poderá ser feito através da análise de imagens gravadas com câmeras.
Experimento que, pelo contorno da pessoa diante de um banner, era possível identificar o sexo e a faixa etária.

·         Passo 2: enriquecimento de dados
Cada click na internet é monitorado. Aí eles cruzam estes dados com o que a gente comprou pela internet. Aí eles cruzam estes dados com nossos cadastros em lojas físicas. Aí eles cruzam com o que a gente comprou na loja física, fora da Internet. Aí eles complementam estes dados sobre nós com nossos perfis nas redes sociais e com o que estamos dizendo em fóruns e blogs (é o Social CRM).
E é possível pegar dados públicos, disponíveis livremente na Internet. Estes dados não identificam pessoas individualmente, mas dão estatísticas sobre grupos de pessoas. Uma empresa pode comprar uma lista telefônica com nome, endereço e telefone de clientes. Mas não sabe classificar os clientes por dados sócio-demográficos. Então, a empresa pode consultar bases públicas sobre setores censitários. Um setor censitário é diferente de um bairro ou quadra; é uma região, geralmente menor que um bairro mas podendo abranger partes de 2 bairros, que foi pesquisada pelo censo do IBGE (exemplos na Figura 24). Então, há informações estatísticas sobre cada setor específico. Imagine que a empresa então possui os seguintes dados sobre uma pessoa: o nome é José da Silva e mora na Rua X, n.41. Bom, usando um sistema de GIS simples, pode-se saber o setor censitário onde ela mora. Depois, procuram-se dados estatísticos sobre este setor e, digamos, temos que neste setor:
                     100% das residências possuem 3 TVs;
                     98% possuem 2 banheiros;
                     90% possuem aparelhos de DVD;
                     90% possuem TVs LCD;
                     etc.
Agora, de posse destas informações estatísticas,  podemos estimar alguns dados sobre José da Silva. Que ele tem 3 TVs, com 100% de chances, que há 98% de chances de ele ter 2 banheiros em casa, e assim por diante.
Então, desta forma, uma empresa combina a lista telefônica com dados censitários e poderá obter um banco de dados de clientes potenciais.
Empresas parceiras também costumam compartilhar dados sobre clientes, por exemplo, administradoras de cartões de crédito, instituições financeiras, redes de varejo, escolas, postos de gasolina, editoras, etc.
E a cada pesquisa que participamos, com o objetivo de concorrer a prêmios, estamos fornecendo mais dados sobre nós.

·         Passo 3: análises e inferências
Inferir é gerar uma informação a partir de outra. Se você compra muito produto congelado no supermercado, a análise destes dados pode ajudar a inferir que:
a) você tem um bom freezer em casa;
b) você não sabe cozinhar ou não gosta;
c) você é uma pessoa muita atarefada e não tem tempo nem para cozinhar.

O nível de inferência é subjetivo de cada organização e certamente aumenta a incerteza sobre a veracidade da informação. Mas muitas empresas assumem o risco desta incerteza, porque mais incerto ainda é não saber nada sobre o cliente.
Tempos atrás surgiram alguns artigos falando sobre Phenomenal Data Mining. Que significa tentar inferir eventos ou atributos de entidades a partir de coleções de dados. É na prática e com seriedade fazer aquela brincadeira de analisar os restos no lixo de alguém. Aí você saberá que tipo de pessoa é, pelo que compre e consome (marcas, tipos de produtos, faixas de preços, etc). Assim, se você compra Xampu feminimo e  desodorante feminino juntos na mesma compra, você é uma mulher. Se comprar Xampu para carro, esponja para lavar carro e creme para polimento de carro, você certamente tem um carro. É claro que há margem para erros.
E utilizando a sabedoria das massas, se numa loja de supermercado a venda de água mineral foi muito acima do normal, é porque faltou água neste bairro. E se na mesma cidade, várias farmácias estão vendendo antigripal, é porque há um surto de gripe. E provavelmente a temperatura também esfriou ou a umidade aumentou.  
E isto já chegou à Internet. O Facebook já consegue inferir nossa orientação sexual e tendência política só analisando nossas "curtidas" (ler a reportagem "Estudo mostra que botão ‘Curtir’ do Facebook revela muito mais do que se imagina sobre o usuário

Há uns tempos atrás, a Microsoft tinha um experimento para inferir sexo e faixa etária de uma pessoa, pelo tipo de assunto que buscava na Internet (http://adlab.msn.com/DPUI/DPUI.aspx). Veja as imagens abaixo. Olhei agora e o experimento é outro (no redirecionamento deste link).




·         Passo 4: ofertas personalizadas ou recomendações
Qual a diferença entre spam e recomendação (ofertas personalizadas): se você receber um SMS às 3h da manhã avisando de promoção (venda de um produto) e:
a) ficar irritado com a operadora: isto é spam;
b) ficar contente e agradecer a operadora porque no dia seguinte irá comprar várias unidades: isto é recomendação.
A recomendação é direcionado a cada indivíduo e não por grupos. É parte do chamado Marketing de Relacionamento ou Marketing 1-to-1 (Peppers & Rogers). Para isto, a empresa precisa saber muito sobre o cliente. Mas é a forma que as empresas têm para diminuir a margem de erro. E ninguém vai deixar de fazer propaganda.
O Google ganha dinheiro assim. Dependendo do que você está procurando na Internet, isto é, das palavras que você coloca no buscador, as propagandas serão diferentes. E elas serão contextualizadas também no seu Gmail. E eles possuem tecnologias para identificar o assunto em vídeos no Youtube, seja pelas palavras no título do vídeo, pelas tags marcadas por quem postou o vídeo ou, com mais tecnologia, pelas palavras que estão no áudio do vídeo.

A privacidade acabou então. Estamos combinados.
O que existe é política de privacidade. Onde a empresa diz que dados está coletando das pessoas, como e para quê. E a pessoa assina ou clica aceitando a política de privacidade. Dizem que apenas 0,4% dos visitantes de um site leem a política de privacidade do site. E quem lê as várias páginas com linhas pequenas nos contratos de serviços ?
O W3C está planejando um protocolo para ajudar usuários a controlarem sua privacidade (o PPP). Funciona assim: cada usuário configura no seu navegador o seu nível de privacidade, isto é, o que permite que um site colete de informações, ao você entrar neste site. O site, embutido no seu código HTML, colocará sua política de privacidade (é claro que estruturada neste protocolo). Quando você estiver para entrar num site, o navegador compara o nível de privacidade do usuário com a política do site. Em caso de incompatibilidade, ele avisa o usuário ou não permite entrar.
Note que os aplicativos baixados para Android já avisam o usuário deste tipo de informação (o que o aplicativo vai fazer, que tipo de conexão ou transferência, ou que dados irá manipular no dispositivo móvel).
Outra iniciativa para controle de privacidade está no novo Código de Defesa do Consumidor 2.0. Nele está dito que as empresas não podem passar adiante dados coletados de uma pessoa. Isto é crime. O problema é como controlar isto. Quando a gente recebe em casa uma propaganda pelo correio normal, a quem vamos culpar ? Quem forneceu nossos dados para esta empresa que enviou a propaganda ?
Alguns Procons já aceitam cadastros para listas brancas contra telemarketing. Por exemplo, você cadastra seu telefone e nenhuma empresa pode ligar para você, sob pena de receber multa. A questão é que as empresas fazem as contas e verificam que é mais vantajoso continuar ligando e pagando a multa.
Na Constituição brasileira está definido o direito de habeas data. Você pode entrar com uma ação de habeas data para adicionar, retirar ou retificar informações em cadastros existentes, desde que a instituição seja pública ou de caráter público. O bom seria permitir a cada cidadão poder fazer isto em qualquer tipo de banco de dados. Ou ao menos, receber uma parcela dos ganhos de propaganda, quando nossos dados forem utilizados.
Agora a Vivo criou um modelo novo de propaganda. Se você aceitar ouvir uma ligação com propaganda no seu celular, você recebe bônus (ler a reportagem "Vivo lança serviço de chamada patrocinada"



2 comentários:

Ed.Londero disse...

Abração profº Stanley ! Algum tempo atrás vi ser ofertado uma caixinha para contar clientes. Oticamente, com lentes e sofwtare para identificar gente caminhando para dentro e para fora da loja.
No meu conhecimento parcial sobre comércio fiz a seguinte hipótese: o lojista tem parte do seu faturamento informal ou descolado do estoque, e quer monitorar se seus empregados não o estão fazendo vendas em seu lugar.
Ou ele deseja saber quantos clientes entram na loja mas não compram nada.
Enfim, um dispositivo que conta pessoas é um passo para um que as identifica.
Sobre privacidade, acabou mesmo. A única maneira de compatibilizar essa privacidade quase nula com segurança e bem estar é uma democracia radical, na qual ninguém tem nada a esconder de ninguém.
Se o cidadão tem sua vida completamente na mão do Big Brother, esse cidadão precisa de um controle fino sobre o Estado.
Mas isso é uma ideia, não se conhece situação que isso tenha funcionado.
Vou ler com calma seu artigo com mais calma.

Stanley Loh disse...

Obrigado, Eduardo, por sua contribuição.
Há quem diga que é mais importante para uma loja saber quem entrou e não comprou nada. Assim, vale mais a informação do que a pessoa queria comprar e não comprou do que o que está registrado no banco de dados (suas compras). Assim, a loja pode adequar-se para não perder mais esta venda.
Sobre o Big Brother, saiu reportagem recente falando que já formas de identificar unicamente pessoas por tatuagens e pílulas. Já tem gente falando que é o 666 chegando.
Abraço.

http://www.techtudo.com.br/noticias/noticia/2013/05/google-quer-usar-tatuagem-e-pilulas-especiais-para-aposentar-senhas.html