Hem yttranden Big data är bara en stor bluff | john c. dvorak

Big data är bara en stor bluff | john c. dvorak

Video: BIG DATA - архитектор матрицы (September 2024)

Video: BIG DATA - архитектор матрицы (September 2024)
Anonim

Den nyligen framväxande "big data" -meme har aldrig definierats på något meningsfullt och definitivt sätt. Det är den mest amorfa nya buzz-term som jag har sett på ett decennium. Det är ett av de "betraktarnas öga" -termer som används för att liva upp ett seminarium och så småningom suga investerare.

Låt oss börja med att fråga vad betyder big data? Massor av data? Mer data än du kan hantera? Amorfa data? Ut ur kontrolldata? Användbara data för analys? Nyttiga uppgifter? Informationsöverbelastning?

Om du läser tillräckligt om big data är det allt ovanstående och mer. Nyckeln är inte uppgifterna utan utmaningen för hur man ska hantera uppgifterna och vad man ska göra med själva uppgifterna.

Med andra ord, hur kan vi göra denna enorma hög med data, som vi har lyckats samla, vara användbar på nya och lönsamma sätt? Datapoolerna kan komma var som helst via olika datormekanismer som Facebook-inlägg, NSA-loggar, e-postlistor, kunder etc.

Jag skulle hävda att de flesta läsare i den här kolumnen själva förvarar stora data. Jag köpte precis en 3 Terabyte-enhet för säkerhetskopiering. Jag har mycket data att säkerhetskopiera! Big data!

Ett användbart verktyg som jag kan föreställa mig skulle vara ett stordataanalysverktyg som polisen kan använda för att hitta dig skyldig till något slumpmässigt brott genom att gå igenom dina filer. Eller åtminstone hitta något som skulle genera dig. Big data!

Allt detta kommer tillbaka till en kommentar från en tidigare VD för American Express, som sa till en publik att om företaget ville (och detta gäller alla kreditkortsföretag) kan det använda dina personliga köpvanor och tendenser för att sätta ihop en komplett dossier och berätta definitivt om du har en affär eller inte. Big data!

Från vad jag kan berätta, det är exakt vad big data gör bäst, spionera på individer.

Branschens populära kommentar är att på något sätt enorma databaser som innehåller information om dig kommer att användas till din fördel. Ja, du vet, så du får s för saker du faktiskt är intresserad av. Riktad reklam. Detta gynnar alla!

Så här fungerar det. Jag är intresserad av att köpa en ny kamera och höra om den nya Bogus One. Jag läste en artikel på PCMag.com om kameran, sedan går jag till Amazon och tittar på priser och användarrecensioner. Det verkar som om ingen gillar kameran. Det är en uppenbar skit. Alla granskare avskedade kameran. Köparna hatar kameran. Det här är inte en kamera jag vill ha. Men mjukvaran för stordataanalys bestämmer mig för att ge mig hundratals annonser på varje webbsida jag besöker, alla visar Bogus One-kameran. Big data!

Det är värre än så. Om saker gick i den andra riktningen och jag bestämde mig för att jag gillade och ville ha kameran och faktiskt köpte kameran skulle jag fortfarande få annonser som uppmuntrar mig att köpa kameran. Big data!

Riktad "big data" -reklam är den största belastningen av baloney, någonsin.

OK, så låt oss glömma det fiaskot och gå över till att använda big data för trender. Big data kan hitta olika nålar i olika höstackar. Så du skulle få något liknande: Fyrtio procent av alla Subaru-köpare är vegetarian / vegan och 80 procent av dem är demokrater. Men det antalet ökade till 60 respektive 90 procent om vi talar om en Subaru Outback. Dessutom ökar den till 99 procent vegetarian / vegan och 99 procent demokrat om bilen är målad grön.

Big data teoretiker skulle ha en fältdag på seminariet med denna information. Men den ignorerar alla variabler som kan ändra beräkningarna och trenderna, som är oändliga. Hur länge kommer någon av denna speciella big data att hålla om VD för Subaru kör upp till en samling i en grön Outback och förklarar att "Alla valar måste förintas!"?

Det kräver inte ens så mycket för att förändra dynamiken i big data-slutsatser. Trots vad American Express-killen säger är data faktiskt blinda. Det är därför du får annonser för produkter som du redan har köpt.

Big data skulle få dig att hoppa till slutsatser.

Om någon köper tio böcker om hur man gör en bomb, betyder det att han vill spränga Federal Building? Tänk om han var expert på bortskaffande av bomber och det inte ingick i hans jobb som poliskonsult? Big data kan inte veta allt ännu. Den kan inte veta vad du tänker. Jag tänker till exempel att Bogus One-kameran suger. Big data kan inte veta det om jag inte förhörs. Och jag kan ljuga om det.

Inget av detta låter bra eller sunt för samhället. Hoppa till slutsatser, göra antaganden, agera på falska antaganden. Hounding allmänheten med värdelösa.

Big data som ett högt begrepp kommer aldrig helt att definiera sig själv och dö en eländig död. Jag hoppas.

Big data är bara en stor bluff | john c. dvorak