Not logged in.

Contribution Details

Type Dissertation
Scope Discipline-based scholarship
Title PeerCollaboration: a peer-to-peer collaboration application for large-scale systems
Organization Unit
Authors
  • Thomas Bocek
Supervisors
  • Burkhard Stiller
  • Torsten Braun
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date 2010
Abstract Text An increasing number of Internet users and growing Internet bandwidth availability and its usage lead to the need for scalable systems, which scale with the increasing number of users and bandwidth. Client/server (C/S) systems have capacity limits and as soon as these limits are reached, the system infrastructure needs to be upgraded or replaced. Peer-to-peer (P2P) systems do not have such capacity limitations, because every participating peer is a client and a server, contributing its resources. Thus, the more users a P2P system has, the more resources are contributed. Compared to C/S systems, P2P systems shift infrastructure expenses from the server to its peers, reducing the expenses at the server-side. However, P2P systems require additional mechanisms to offer the same functionality as a centralized system. Large-scale C/S systems such as Wikipedia, Facebook, or YouTube need to keep extending their server infrastructure due to increasing end-user bandwidth and number of users. To cover theses infrastructure expenses, operators of such C/S systems need to generate sufficient revenues. Lack of revenues leads to reducing or shutting down services. Since P2P systems distribute its infrastructure expenses among its peers, operators could run such C/S systems at a lower cost if changing to a P2P system. The advantages for various P2P systems have been demonstrated by many real-world applications, such as file sharing applications, Voice over Internet Protocol applications, or media streaming applications. However, new types of P2P applications are still challenging as they require new distributed mechanisms and algorithms. The goal of this thesis is to present new distributed mechanisms and algorithms for a scalable, robust, and fault-tolerant, P2P document collaboration system. In a P2P document collaboration systems, users share the resources necessary to host and distribute documents. Supported tasks in such a system are searching, retrieving, creating, changing, and maintaining documents. This thesis presents the design, implementation and evaluation of the PeerCollaboration application and its three key features that have not been profoundly researched to date: (1) a new robust transitive tit-for-tat incentive mechanism to encourage peers to contribute resource and to discourage free-riders is presented. Each peer needs to contribute resources, such as providing documents to other peers, to make the system scalable; (2) a new efficient fast similarity search algorithm is presented to search for documents with misspelled text; (3) a new user-based voting mechanism is presented to maintain or improve the quality of user-generated documents and to provide decentralized administration mechanisms.
Zusammenfassung Die steigende Anzahl der Internet-Benutzer, der Internet-Bandbreite und deren Nutzung führen dazu, dass skalierbare Systeme benötigt werden. Solche Systeme skalieren mit der Anzahl der Benutzer und deren Bandbreite. Die auf Client-Server (C/S) basierenden Systeme haben beschränkte Kapazitäten. Sobald diese Kapazität erreicht ist, muss das System erweitert oder ersetzt werden. Peer-to-peer (P2P) Systeme haben diese Beschränkung nicht, da jeder teilnehmende Benutzer zugleich ein Client und Server ist, der seine Ressourcen beisteuert. Folglich, je mehr Benutzer es in einem P2P-System hat, desto mehr Ressourcen sind verfügbar. Im Vergleich zu C/S Systemen, verteilen die P2P Systeme die Infrastrukturausgaben auf ihre Peers und reduzieren die Ausgaben auf der Server Seite. Um die gleiche Funktionalität wie in einem C/S-System zu erreichen, müssen jedoch in einem P2P-System zusätzliche Mechanismen verwendet werden. C/S-Systeme mit vielen Benutzern wie Wikipedia, Facebook oder YouTube müssen die Serverinfrastruktur der erhöhten Bandbreite und erhöhten Benutzeranzahl anpassen. Dies setzt finanzielle Einnahmen voraus, um die Ausgaben zu decken. Wenn diese Ausgaben nicht gedeckt werden können, müssen die Dienste reduziert oder gar abgeschaltet werden. Da P2P-Systeme die Infrastrukturausgaben auf ihre Peers auslagern, können solche C/S-Systeme bei einem Wechsel zu P2P-Systemen mit weniger Ausgaben auf der Betreiberseite auskommen. Die Vorteile von verschiedenen P2P-Systemen wurden bereits mit realen Programmen wie zum Beispiel Tauschbörsen, Voice over Internet Protocol-Applikationen oder Streaming-Applikationen demonstriert. Neue Typen von P2P-Applikationen stellen dennoch eine Herausforderung dar, da diese neue, verteilte Mechanismen und Algorithmen benötigen. Das Ziel dieser Arbeit ist, neue verteilte Mechanismen und Algorithmen für ein skalierbares, robustes, fehlertolerantes und voll- ständig dezentrales Dokumenten-Kollaborationssystem zu zeigen. In einem Dokumenten-Kollaborationssystem teilen sich die Benutzer die Ressourcen, um Dokumente zu verteilen und um diese anderen Benutzern anzubieten. Unterstützende Aufgaben in diesen Systemen sind die Suche, das Abrufen, das Erstellen, das Ändern und der Unterhalt von Dokumenten. In dieser Arbeit werden das Design, die Implementation und die Evaluation der PeerCollaboration-Applikation und deren drei Haupteigenschaften präsentiert, die aktuell noch nicht in der notwendigen Tiefe behandelt wurden: (1) ein neuartiger, robuster, transitiver tit- for-tat Anreizmechanismus wird gezeigt, um Anreize zu schaffen, damit sich ein Benutzer nicht trittbrettfahrend verhält. Jeder Benutzer muss seine Ressourcen beisteuern, wie zum Beispiel das Bereitstellen von Dokumenten, um das System skalierbar zu machen; (2) eine neuartige Ähnlichkeitssuche wird gezeigt, die es ermöglicht, falschgeschriebene Texte in Dokumenten zu finden; (3) ein neuartiges, benutzerbasiertes Abstimmungsverfahren wird gezeigt, um die Qualität der von Benutzern erstellten Dokumente beizubehalten oder zu verbessern, und um dezentralisierte Administrationsaufgaben zur Verfügung zu stellen.
PDF File Download
Export BibTeX
EP3 XML (ZORA)