WYSZUKIWANIE:

Data Shuffling: tasowanie danych zgodnie z prawem

Computerworld
7 lipca 2008 10:20
, Wiesław Pawłowicz
reklama
Polecamy
Rekomendacje
O tym też piszemy...
10 przełomowych technologii, które zmieniły świat
Zastanawialiście się kiedyś, jak wyglądałby świat bez satelitów telekomunikacyjnych, ogólnodostępnych komputerów osobistych, szerokopasmowego dostępu...
Światło nośnikiem danych w komputerze - Intel ma prototyp układu
W laboratoriach Intela powstał prototyp krzemowego połączenia optycznego ze zintegrowanymi laserami, mogącego przesyłać dane z szybkością 50 Gb/s.
Najgłośniejsze przecieki z WikiLeaks
Lipiec 2010 r. - serwis WikiLeaks wchodzi w posiadanie ponad 90 tys. dokumentów wojska i wywiadu, zawierających szczegółowe informacje dotyczące...
Pecet własnej roboty
Własnoręcznie złożony pecet to nie tylko oszczędność pieniędzy, która w zależności od konfiguracji może wynieść od dwustu nawet do kilku tysięcy...
StarCraft II. Wings of Liberty - porady jak grać, by wygrać
Gra StarCraft II. Wings of Liberty od 27 lipca jest oficjalnie dostępna w sprzedaży. Szczęśliwi posiadacze kopii gry z pewnością bezzwłocznie...
Procesor z turbodoładowaniem. Jak przyspieszyć CPU
Wydajność nowoczesnych procesorów Intela i AMD da się zwiększyć nawet o 30% bardzo łatwo i za darmo. Umożliwia to tryb turbo. Wyjaśniamy, jak działa...
Składanie komputera - wideoporadnik, jak samodzielnie złożyć zestaw PC
Oto krótki wideoporadnik, który przeprowadzi cię przez proces samodzielnego składania komputera. Z poszczególnych filmów dowiesz się jak zamontować...
Technika Data Shuffling umożliwia udostępnianie i analizę wrażliwych informacji przy zachowaniu wymagań prawnych dotyczących ochrony danych.
Innowacyjna technologia umożliwiająca ochronę przed wyciekiem wrażliwych informacji być może już wkrótce znajdzie praktyczne zastosowania. Naukowcy z Department of Management Science & Information Systems na uniwersytecie stanowym w Oklahoma uzyskali finansowanie nowego projektu, którego zadaniem jest opracowanie oprogramowania umożliwiającego praktyczne wykorzystanie opatentowanej przez nich już wcześniej techniki Data Shuffling (tasowanie danych).

Co to jest Data Shuffling

Jak wyjaśnia prof. Rathindra Sarathy, kierujący grupą badawczą, Data Shuffling to technika maskowania danych numerycznych umożliwiająca ich wykorzystanie do celów analitycznych przy jednoczesnym zapewnieniu poufności informacji. Jako przykład podaje on problem z udostępnianiem danych o zarobkach pracowników analitykom przygotowującym ogólne raporty. Regulacje prawne nie pozwalają na ujawnienie takich informacji, bo nawet jeśli dane osobiste zostaną usunięte z pliku, to możliwa jest prosta analiza umożliwiająca odtworzenie powiązań liczb z dotyczącymi ich osobami. Klasyczne metody szyfrowania nie są tu pomocne, bo - aby skorzystać z danych - analityk i tak musi być w stanie je odszyfrować.

Natomiast Data Shuffling umożliwia inteligentną modyfikację informacji w praktyce uniemożliwiającą identyfikację oryginalnych liczb, a jednocześnie zapewniającą, że wyniki zbiorczej analizy są prawidłowe. Jej koncepcja jest względnie prosta, a można ją wyjaśnić na przykładzie zbioru danych zawierających tysiące informacji o wieku, wykształceniu, zarobkach, nazwiskach itp. określonych osób, które nie mogą być dowolnie udostępniane. Tasowanie danych umożliwia ich wymieszanie, tzn. przypisanie zarobków 55. osoby na liście tej, która jest na pozycji 500 itd. W ten sposób następuje takie przetasowanie informacji, że relacje m.in. stają się całkowicie zamaskowane i niemożliwe do odtworzenia przez osobę nieuprawnioną. W praktyce pozwala to na ujawnienie poufnych liczb i relacji przy zachowaniu wymagań prawnych dotyczących ochrony informacji osobistych.

"Prawdziwa użyteczność tej techniki ujawnia się w sytuacjach, gdy analizowane są skomplikowane zależności między wieloma różnymi parametrami zawierającymi zarówno informacje poufne, jak i jawne" - mówi Rathindra Sarathy.

Gorąca technologia?

Koncepcje tego typu są badane przez wielu naukowców. Opatentowana technika tasowania danych jest tylko jednym z przykładów technologii maskowania wrażliwych danych. Na razie jest to jednak technika wyraźnie niedoceniana przez firmy i organizacje, które wciąż nie zdają sobie sprawy jak potężne może to być narzędzie. "Dlatego jej promocja i edukacja to najważniejsze zadania, które chcemy podjąć" - mówi Rathindra Sarathy.

Jeśli chodzi o komercyjne aplikacje, to obecnie na rynku jest już przynajmniej kilka ofert tego typu produktów, ale są to względnie proste rozwiązania, których funkcjonalność jest znacznie mniejsza w porównaniu do Data Shuffling. W praktyce technika ta może zostać wykorzystana w niezależnych aplikacjach, jako dodatkowy moduł uzupełniający funkcjonalność innych programów (np. arkusza kalkulacyjnego) lub też nawet jako webowa usługa XML. Przeprowadzone testy prototypowych tego typu rozwiązań potwierdzają praktyczne możliwości takich zastosowań.
Oceń:
Aktualna ocena (Głosów: 2)


olowek Wasze komentarze (3) +DODAJ komentarz

KOMENTARZE

Redakcja IDG.pl nie ponosi odpowiedzialności za wypowiedzi Internautów opublikowane na stronach serwisu oraz zastrzega sobie prawo do redagowania, skracania bądź usuwania komentarzy zawierających treści zabronione przez prawo, uznawane za obraźliwie lub naruszające zasady współżycia społecznego. Osoby zamieszczające wypowiedzi naruszające prawo lub prawem chronione dobra osób trzecich mogą ponieść z tego tytułu odpowiedzialność karną lub cywilną.

  • ~Gość

  • ocena: brak oceny
  • IP: 83.28.56.252
  • 07-07-2008, 11:19

Dobra dobra a skąd ta osoba-analityk wie jak te dane przypisać poprawnie ? Znowu jest problem sysrybucji tajnego klucza

  • tad

  • ocena: 4
  • IP: 83.24.98.180
  • 07-07-2008, 11:37

a mnie ciekawi, czy takie pozamienianie wartości kluczy obcych między różnymi tabelami bazy danych (czy to już ten cały shuffling, czy coś jeszcze mądrego tam jest?) to zabezpiecza przez wykryciem jakie są najwyższe zarobki w firmie/dziale/oddziale oraz czy zabezpiecza przez wykryciem jaka jest średnia zarobków wśród mających dane wykształcenie lub staż lub stanowisko lub zaszeregowanie (level). Albo choćby wykrycie dobrego przybliżenia jakie są zarobki średnie specjalistów przez: pominięcie takiego procentu najwyższych zarobków jaki procent stanowi kadra kierownicza w stosunku do wszystkich zatrudnionych, itd. Podobnie z innymi ciekawymi/ciekawszymi danymi właśnie do uzyskania w wystarczającym przybliżeniu na tejże to drodze statystycznej w powiązaniu z konkretną wiedzą o organizacji firmy (a zwykle i bez tej wiedzy wszystko co warto było wiedzieć było osiągalne).
Myśmy takie rzeczy robili jeszcze dawno temu, bez patentu, a pensja prezesa i wiceprezesów były minimalne, ułamek przeciętnej - faktycznie zarabiali na procencie od zysku i na wykonaniu innych wskaźników dla rady nadzorczej, co pokazaliśmy dla kierownictwa jako zabawę dla naiwnych.
Teraz nawet to będzie to nielegalne, bo jest patent i nie będzie wolno mieszać danych :)

  • tad

  • ocena: 4
  • IP: 83.24.98.180
  • 07-07-2008, 12:06

@Gość - ale tam nie ma szyfrowania za pomocą klucza a jedynie za pomocą pozamieniania miejscami (zapewne) konkretnych relacji między rekordami w tabelach bazy danych, nie ma potrzeby wiedzieć jak to zostało zamienione.
Czyli sortuje się klucze obce w ramach wybranych tabel bazy danych (np. z tabeli o zarobkach sortuje się klucz obcy wiążący wiersze tej tabeli z wierszami tabeli o danych personalnych, itd.) Jak za daleko pujdzie to sortowanie (np. zarobki względem wykształcenia) to nie będzie można tego odtworzyć. Ciekawe czy to już jest ten patent, bo to była bardzo elementarna operacja i w praktyce niewystarczająco skuteczna dla ochrony informacji o elitach danych grup.


Twój komentarz
Nick: Adres e-mail:
brak oceny 1 2 3 4 5
Treść komentarza

Uwaga: Adres www wpisujemy w specjalnych znacznikach [[www.adres.pl]]
Serwisy IDG: IDG.pl | PC World | Ranking Produktów PCW | Business Center PCW | Computerworld | NetWorld | Kino Domowe
CEO | CIO | CFO | Gamestar | Internet Standard | ITpedia | IT Standard
Warunki obsługi - Kontakt - Regulamin
Polityka prywatności - Serwis zgodny z ASME
Reklama - Licencjonowanie treści -
© Copyright 2010 International Data Group Poland S.A.
04-204 Warszawa ul. Jordanowska 12
tel.(+4822)321-78-00   fax(+4822)321-78-88