GOR 2001 Homepage

Articles
all sorted by author

by category
indiv. differences
web based experiments
basic research
e-commerce
market research
teaching - learning
cmc in organizations

article-info

Abstracts

Indices
first-author-index
complete-author-index

Management - Staff only
Infos

GOR 2001 - Articles

Currently the following articles are available for the GOR-Conference in Spring 2001 in Göttingen (ordered by name of first author):


Bamert,Thomas ; Reips, Ulf-Dietrich Institution: Universität Zürich
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Online Befragung zur Webpage-Evaluation."


Batinic, Bernad ; Institution: Lehrstuhl für Wirtschafts- und Sozialpsychologie, Friedrich-Alexander-Universität Erlangen-Nürnberg
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Trendsetter im Internet."


Baur,Timo ; Kolo, Castulus Institution: Ludwig-Maximilians Universität München
Article (version: 25/06/2002 - 07:47, size: 38663)
"Feldforschung in Multiplayer-Onlinespielen."
German:

Feldforschung in Multiplayer-Onlinespielen

Baur, Timo (Ludwig-Maximilians-Universität München)

Kolo, Castulus (Ludwig-Maximilians-Universität München, SV Online GmbH)

Abstract

In Multiplayer-Onlinespielen finden die Interaktionen der gespielten Figuren in einer verteilten, simulierten Umgebung statt. Die heute am weitesten entwickelten Spiele sind darüber hinaus mit einer Vielzahl grafischer Elemente versehen. Abgesehen von technisch bedingten Einschränkungen sind die von den Spielern gesteuerten Figuren frei in ihren Spielzügen und spannen damit ihrerseits einen sozialen Interaktionsraum auf. Oberthema der hier vorgestellten Untersuchung im Onlinespiel Ultima Online ist die Verknüpfung von Charakteristika der Spieler und sozialer Phänomene in deren Alltagswelt mit den Phänomenen innerhalb der Spielwelt, deren Figuren-Ensemble als teil-simulierte "Gesellschaft" aufgefasst wird.

Die Phänomene in und um Ultima Online wurden unter anderem durch eine standardisierte E-Mail-Befragung, durch offene Online-Interviews und durch teilnehmende Beobachtung sowohl in der Spielwelt als Mitspieler als auch der Spieler beim Spielen erschlossen. Es werden potentielle Einschränkungen der einzelnen Untersuchungsperspektiven und Methoden dargestellt und an ausgewählten Ergebnissen erläutert. Für die Zusammenführung der über verschiedene Methoden gewonnenen qualitativen und quantitativen Daten zu einer vollständigen Beschreibung wird ein Modell zur Strukturierung von Spielsituationen vorgeschlagen.

Die darauf aufsetzende Analyse gibt zunächst Aufschluss über soziodemographische Merkmale und die Motivation der Spieler sowie die Nutzungscharakteristika. Es werden schließlich als Beispiel für emergente Phänomene innerhalb von Ultima Online die Bildung sozialer Formationen und die Verteilung von Vermögen der Spielfiguren diskutiert. Dabei wird die Verschränkung des Alltagslebens der Spieler mit der Welt der Spielfiguren und die Notwendigkeit einer gekoppelten Analyse beider Bereiche deutlich. Multiplayer-Onlinespiele liegen damit auf halbem Wege zwischen dem Untersuchungsgegenstand klassischer sozialwissenschaftlicher Forschung und vollständig simulierten "artificial societies".

Vorliegender Beitrag ist das erste publizierte Ergebnis eines interdisziplinären Projektes am Institut für Völkerkunde der Ludwig-Maximilians-Universität München (Baur 2000). Die Untersuchung eines Multiplayer-Onlinespiels mit einer aufwendig programmierten grafischen Spielumgebung war zunächst nicht hypothesengeleitet sondern explorativ angelegt. Als Oberthema kristallisierte sich jedoch die Verknüpfung von Charakteristika der Spieler und sozialer Phänomene in deren Alltagswelt mit den Phänomen innerhalb der Spielwelt heraus. Der Beitrag soll anhand erster Ergebnisse Multiplayer-Onlinespiele mit grafischer Spielumgebung und mehreren tausend simultanen Teilnehmern als lohnenden Untersuchungsgegenstand vorstellen und offene Fragen für weitere Untersuchungen herausstellen.

Multiplayer-Onlinespiele

Das Genre der sogenannten "Massive Multiplayer Online Games" (im folgenden MMPOG abgekürzt), "Massive Multiplayer Online Role Playing Games" oder auch "Persistent Online Worlds" kann als Teilmenge von Computerspielen für mehrere informationstechnisch vernetzte Teilnehmer (Multiplayer-Onlinespiele oder kurz MPOG) aufgefasst werden. Diese neue Form von Multiplayer-Onlinespielen ist für bis zu mehrere Tausend simultan spielende Spieler konzipiert und stellt darüber hinaus grafische Umgebungen bereit, die der realen Welt in Funktionalität (im Sinne von Handlungsmöglichkeiten) und Aussehen ähneln.

Betrachtet man die Zahl der Internetnutzer, die bereits an Online-Spielen teilnahmen und die kommerziellen Perspektiven, die mit derartigen Anwendungen gesehen werden, dann hat diese Form der Internetnutzung längst das Dasein als exotisches Randphänomen verlassen. Die ARD/ZDF-Onlinestudie 2000 hat beispielsweise ergeben, dass 24 % aller Internetnutzer gelegentlich schon Onlinespiele im weitesten Sinne genutzt haben, 7 % spielen einmal wöchentlich (ARD/ZDF-Arbeitsgruppe Multimedia 2000). Marktanalysten von Jupiter erwarten bis 2002 einen Anstieg der weltweiten Umsätze von etwa 100 Millionen US $ in 1999 auf mehr als das vierfache. Der Marktanteil von Online Spielen am gesamten Spielemarkt wird laut Forrester dann 25 % betragen.

Umso erstaunlicher ist es, dass MMPOG, die seit etwa vier Jahren einen starken Zulauf erfahren, bis auf wenige Arbeiten wie z.B. die eher deskriptive und qualitative Untersuchung von Berger (2000) oder von Simpson (1999) zum Wirtschaftskreislauf in einem Online-Spiel bislang wenig untersucht sind. Zu den rein textbasierten Spielen wie Multi User Dungeons hingegen gibt es zwar zahlreiche Veröffentlichungen (z.B. Reid 1994), an die jedoch aufgrund der hier eingeschränkten Handlungsmöglichkeiten und des Fehlens der grafischen Elemente nur begrenzt angeknüpft werden kann.

Für die hier vorgestellte Untersuchung wurde das Spiel Ultima Online (im folgenden UO abgekürzt) ausgewählt, das aus der PC-Spiel-Serie Ultima für einen Spieler hervorgegangen ist. Dieses Spiel wurde im September 1997 von der Firma Origin Systems International auf den Markt gebracht, und war der erste Versuch, eine große und komplexe virtuelle Welt über das Internet anzubieten. Ultima Online hatte sich bis zum Zeitpunkt der Studie im Januar 2000 bereits gut etabliert, und es konnte davon ausgegangen werden, dass die beobachteten Phänomene nicht nur die Anfangssituation wiedergeben. Eine durchgeführte Befragung (siehe unten) bestätigte, dass die durchschnittliche Spielerfahrung zum Zeitpunkt der Untersuchung 14 Monate betrug. Weiterhin war Ultima Online zu diesem Zeitpunkt das hinsichtlich der möglichen Teilnehmerzahl größte derartige Spiel für das Internet. Bereits im Juni 1999 gab es weltweit ca. 130.000 aktive Abonnenten. Heute sind es nach Angaben des Herstellers etwa doppelt so viele.

Das Genre der MMPOG knüpft einerseits an bereits zuvor existierende PC-Spiele an. So gaben die befragten Nutzer von UO zu 85 % an, sie hätten bereits Erfahrung mit Computerspielen aus dem Rollenspiel- oder Adventurebereich. Andererseits wird in der Spielgestaltung eine Tradition der Offline-Fantasyspiele (Tabletop-Spiele) wie z.B. Advanced Dungeons & Dragons oder Das Schwarze Auge fortgeführt, die ebenfalls von 63 % der hier untersuchten Nutzer von UO bereits gespielt wurden. Auch der Anteil der Live-Rollenspieler ist mit 25 % auffällig. Live-Rollenspiele sind eine besondere Art des Offline-Rollenspiels, bei der die Teilnehmer in einer Art Stegreiftheater eine Rolle übernehmen und diese dann für eine beschränkte Zeit und in einem bestimmten Ambiente spielen.

Vor der weiten Verbreitung des Internet waren Post- oder E-Mail-Spiele die naheliegende räumliche Erweiterung sowohl von Tabletop-Spielen als auch von Live-Rollenspielen über die Face-to-Face-Spielsituation hinaus. Die ersten Anwendungen für simultanes Spielen über das Internet kamen mit den Multi User Dungeons (MUDs) auf. In diesen Spielen werden gemeinsam mit anderen Spielern in Textform beschriebene Umgebungen erkundet und gemeinsam Aufgaben gelöst. MUDs stellen Vorläufer der heutigen grafischen MMPOG dar, waren allerdings aufgrund der komplizierten Steuerungsbefehle auf eine wesentlich geringere Zahl technisch versierter Nutzer beschränkt.

Die Welt in Ultima Online

Der Eintritt in die Welt von Ultima Online setzt einige vorbereitende Schritte für den Spieler in spe voraus. Neben einem Internetzugang und einem heute handelsüblichen PC ist der Erwerb einer Spielsoftware und die Zahlung einer monatlichen Gebühr von 10 US $ notwendig. Nach Freischaltung durch den Hersteller und Installation der Software hat man schließlich Zugang zur Spielumgebung, die ständig mit einem zentralen Server synchronisiert wird. Regelmäßig wird die Software um kostenpflichtige Zusatzpakete erweitert.

Der erste Schritt im Spiel ist die Wahl einer Spielfigur. Die Spielumgebung in UO ist in einem mittelalterlichen Ambiente gehalten und dementsprechend auch die möglichen Spielfiguren.Das Spiel bietet mehrere Berufe zur Auswahl, wie z.B. Alchimist, Magier, Schwertkämpfer, Abenteurer, Bergmann, Schmied oder Holzfäller. Weiter kann man das Geschlecht, die Haartracht, Haarfarbe, Hautfarbe, das Gesicht und die Heimatstadt der Figur wählen. Neben den Spielfiguren, die von den Spielern durch das Fantasieland namens "Britannia" geführt werden gibt es auch Figuren, die rein von der Serversoftware simuliert sind (sog. Nichtspielercharaktere oder NPC) wie zum Beispiel verschiedenste Fabelwesen aber auch Händler, Arbeiter usw., die sich in ihrer grafischen Repräsentation nicht von den gespielten Figuren unterscheiden. Die Welt ist ferner mit Tieren bevölkert, die als Rohstoff z.B. für Leder oder gezähmt auch als Weggefährten dienen.

Abbildung 1: Beispiel für die Gestaltung der grafischen Spielumgebung in UO und die Einblendung textbasierter Kommunikation

Jede Spielfigur ist von Beginn an mit einer Reihe von wählbaren Fähigkeiten oder "skills" ausgestattet, die im Laufe des Spiels durch Übung bzw. Meistern bestimmter Situationen gesteigert werden können. Ferner gehören verschiedene dem gewählten Berufsstand entsprechende Gegenstände und ein Betrag von 100 GP ("Goldpieces", Gegenwert von z.B. eineTisch und vier Stüe oder einem Bronzeschild), der Währung von UO, zur Grundausstattung. Meist findet bereits unmittelbar nach dem Eintritt in die Spielwelt die erste Interaktion mit anderen statt. Der Spieler lernt so sukzessive neue Handlungsoptionen kennen und erfährt die verschiedenen im Spiel angelegten Produktionsketten: Minenarbeiter bauen Erz ab, Schmiede machen Eisenbarren daraus, aus denen dann beispielsweise Schwerter geschmiedet werden können, die z.B. an Krieger verkauft werden. ?hnliche Produktionsketten gibt es u.a. für Kleidung oder Möbel. Gejagtes, Gesammeltes oder Gefischtes kann selbst verzehrt oder ebenfalls z.B. mit Gasthaus- oder Ladenbesitzern gehandelt werden. Neben unmittelbar nachvollziehbaren Handlungsmöglichkeiten wie z.B. der Fortbewegung per Pferd, der Kommunikation per eingetipptem Text, des Handelns von Gütern oder der kämpferischen Auseinandersetzung sind auch Möglichkeiten vorgesehen, die sich im normalen Leben nicht finden wie z.B. das Sprechen eines Zaubers und die Überwindung von im Spielkontext "großen" Distanzen über sogenannte "Moongates".

Die meisten Spielfiguren werden nicht als Einzelgänger durch die Welt von UO geführt. Die Bildung sozialer Formationen unter den Spielfiguren wird begünstigt durch die Gestaltung der Spielumgebung. So weist ein Veranstaltungskalender die Spieler darauf hin, wo und wann sie über Ihre Figur an verschiedenen Wettbewerben teilnehmen können oder welche Hochzeiten zwischen männlichen und weiblichen Spielcharakteren anstehen. Eine besondere Rolle nehmen sogenannte Gilden ein, Vereinigungen von Spielern, die auf Mitgliederlisten explizit genannt werden und deren Bildung softwareseitig unterstützt wird. Für die Aufnahme in eine Gilde müssen von den Gildenmitgliedern frei ausgehandelte Aufnahmeriten durchlaufen werden. Die Gilden werden repräsentiert von einem Gildenmeister, der Titel vergeben kann, Neulinge aufnimmt und die Gilde nach außen repräsentiert. Die in einer Gilde Online repräsentierten Spieler treffen sich oft auch Offline oder pflegen über andere Kommunikationskanäle (z.B. Email, ICQ oder Telefon) außerhalb UO Kontakte.

Beobachtungsmodell und Untersuchungsdesign

Zur Untersuchung der Phänomene in und um UO wurden zwischen Ende 1999 und Februar 2000 fünf komplementäre Methoden eingesetzt, um Daten zu erheben:

  • Offene Interviews über das Internet: Mit der Absicht, qualitative Informationen über bestimmte Aspekte des Spiels zu gewinnen und Gründe für Charakteristika bestimmter Figuren zu finden, wurden offene Interviews über das ICQ-Mitteilungssystem geführt, dem bevorzugten parallelen Kommunikationsmedium vieler Spieler während des Spiels.
  • Teilnehmende Beobachtung von Spielern in der häuslichen Spielsituation: Um typische Spielsituationen einschätzen zu können, sowie um auch Offline-Verhaltensweisen der Spieler beobachten zu können, wurde eine teilnehmende Beobachtung des Geschehens mit zwei Spielern in einer typischen Umgebung durchgeführt. Dadurch konnten typische Spielsituationen identifiziert und qualitativ erfasst werden.
  • Teilnehmende Beobachtung des Spielgeschehens aus der Perspektive des Mitspielers: Um qualitative Informationen und Aufzeichnungen zu besonderen Ereignissen zu gewinnen, wurde in mehreren Sitzungen das Spielgeschehen aus der Perspektive des Mitspielers untersucht. Dazu wurde u.a. eine Hochzeit besucht und anschließend das Brautpaar befragt. Hierbei gab sich der Beobachter als solcher zu erkennen.
  • Standardisierte Befragung auf der Basis eines im WWW eingestellten Fragebogens, der per E-Mail zurückzusenden war (Selbstselektion der Teilnehmer): Die Befragung zu Spieler- und Figurencharakteristika sowie sozialen Aspekten wie z.B. dem Freundeskreis wurde auf Web-Sites beworben, die unter UO-Spielern bekannt sind. Nach 104 eingegangenen Fragebögen wurde diese Erhebung abgeschlossen. Hierdurch konnten quantitative und qualitative Daten über Soziodemographie, Motivation, gewählte Figuren und Aspekte des Alltagslebens der Befragten gewonnen werden.
  • Standardisierte Befragung der namentlich bekannten Mitglieder zweier Spieler-Gilden (gezielte Befragung): Um die Struktur der Gilden darstellen und netzwerkanalytisch auch formal untersuchen zu können, wurden die Mitglieder durch die Verwendung gleichartiger Fragen, sog. Namensgeneratoren (siehe dazu Schweizer 1996:245f), nach den wichtigsten anderen Figuren im Umfeld der eigenen Spielfigur befragt. Die Fragebögen wurden dabei über den Gildenmeister an die Mitglieder verteilt und per E-Mail zur Auswertung zurückgesandt.

Durch die strukturierte Befragung der Spieler konnte eine quantitative Datenbasis geschaffen werden, deren Aussagen durch die Ergebnisse der offenen Interviews sowie der teilnehmenden Beobachtungen ergänzt und hinterfragt wurden. Die Selbstselektion in der strukturierten Befragung führt zwar dazu, dass die Ergebnisse nur eingeschränkt verallgemeinerbar sind. Doch ein Vergleich mit Ergebnissen aus den anderen Untersuchungsmethoden bot keine Anhaltspunkte dafür, dass die aggregierten Aussagen zu Charakteristika der Nutzer und der Nutzung atypisch wären und auf einer Anreicherung von Ausnahmespielern beruhten.

Um die Ergebnisse der verschiedenen Methoden schließlich für eine Analyse zusammenzuführen, ist eine Strukturierung der Spielsituationen hinsichtlich der Beobachtungsperspektiven bzw. der beobachteten Elemente hilfreich.

Abbildung 2: Die unterschiedlichen Schichten einer Spielsituation und die den Schichten zugeordneten Beobachtungselemente

Bei der Datenerhebung werden drei verschiedene Schichten der Spielsituation betrachtet: die Offline- oder Alltagswelt, die Online- oder Spielwelt sowie die beide verbindende Schicht der technischen Infrastruktur und Steuerungsprogramme (vgl. Abbildung 2). Nicht nur der Beobachter sondern auch der Spieler bezieht sich in seinen ?ußerungen jeweils auf eine der verschieden Schichten. Das vollständige Bild einer Spielsituation entsteht dabei erst durch die Zusammenschau der Vorgänge in allen Schichten, denn: "The opposition of real and virtual [...] completely misses the complexity and diversity of relationships that people may pursue through the communicative media that they embed in their ongoing social lives." (Miller, Slater 2000:55)

Neben dieser horizontalen Strukturierung der Spielsituationen in Schichten lassen sich die untersuchten Phänomene in einer vertikalen Struktur entsprechend ihrer sozialen Komplexität einteilen (vgl. Abbildung 3): Die Mikro-Ebene des einzelnen Spielers bzw. der Spielfigur, die Meso-Ebene der sozialen Formationen (Spieler-Cliquen bzw. Gilden der Spielfiguren) und die Makro-Ebene der gesamten Spieler-Gemeinschaft bzw. der "Gesellschaft" der Spielfiguren in UO.

Offlinewelt (Realwelt)

Daten- und Programmschicht

Onlinewelt (Spielwelt)

Makrowelt der Spieler
Gesamtheit der UO-Spieler

Makrowelt der Spielfiguren
z.B. Vermšgensverteilung

Mesowelt der Spieler
soziale Formationen der Spieler
z.B. Spielertreffen

Mesowelt der Spielfiguren
soziale Formationen der Figuren
z.B. Gilden

Mikrowelt der Spieler
Charakterisierung der Spieler
und individueller Situationen

Mikrowelt der Spielfiguren
Charaktere, Eigenschaften,
Handlungsoptionen der Figuren

Abbildung 3: Horizontale und vertikale Strukturierung der beobachteten Phänomene

Die nachfolgende Darstellung ausgewählter Ergebnisse orientiert sich an diesem Modell. Zunächst wird der typische Spieler charakterisiert. Ausgangspunkt dafür ist die soziale Mikroebene in der Offlinewelt. Über die Motivation der Spieler wird der Bezug zur Onlinewelt des Spiels hergestellt. Schließlich werden soziale Meso- und Makrophänomene in der Spielwelt erläutert. Es zeigt sich dabei erwartungsgemäß, dass diese nur verständlich sind, wenn ein Rückgriff auf die dahinterliegenden Spieler erfolgt. Besonders deutlich wird die Kopplung von Spielwelt und Alltagsleben in der Gegenüberstellung von Geschlechterrollen und Freundschaftsbeziehungen.

Charakterisierung der Onlinespieler

Der typische Spieler von UO ist mit einem Durchschnittsalter von 24 Jahren jünger als der Durchschnitt der Internetnutzer (vgl. Abbildung 4) und damit auch jünger als der Bevölkerungsdurchschnitt. Auffällig hoch ist mit 52 % der Anteil der Berufstätigen unter den Spielern. Die anderen Spieler befinden sich in verschiedenen Formen der Ausbildung. Eine Untersuchung des Morgengrauen-MUD erfaßte demgegenüber einen Anteil von fast 90 % Studierender (Schildmann, Wirausky und Zielke 1995).

Abbildung 4: Altersverteilung der UO-Spieler

Die durchschnittliche Dauer eines Spieles beträgt etwa 4 Stunden wobei auch "Sessions" bis zu 12 Stunden angegeben wurden (vgl. Abbildung 5). Der typische Spieler ist mit durchschnittlich 5,7 mal pro Woche fast täglich in UO. Insgesamt errechnet sich daraus eine Gesamtspieldauer von wöchentlich etwa 23 Stunden. Mit 92 % dominiert der Anteil der Spieler, die zumindest teilweise von zu Hause aus ans Netz gehen. Angesichts der typischen Spielzeit zwischen 18 Uhr und 4 Uhr morgens (siehe Abbildung 6) ist dies nicht überraschend. Die meisten Spieler sind dabei auf die Nutzung einer Telefonleitung angewiesen. Wie aus den offenen Interviews hervorging, sind Telefonrechnungen von über 150 DM keine Seltenheit.

Abbildung 5: Verteilung der typischen Dauer von Spiel-"Sessions"

 

Abbildung 6: Verteilung der Tages- und Nachtzeiten, an denen UO gespielt wird

Es gibt bei Ultima Online keinen expliziten Auftrag, den die Spieler erfüllen müssen. Angesichts der deutlichen Investition von Zeit und Geld stellt sich die Frage, was die Spieler zu einem solchen Einsatz motiviert. Wie die Befragung zeigte, ist der Mehrzahl der Teilnehmer das Erleben des Entstehens und sich Entwickelns einer eigenen "Gesellschaft" in der Onlinewelt sehr wichtig (siehe Abbildung 7). Die Möglichkeit, mit Tausenden von Mitspielern über die Figuren zu interagieren rangierte in der Wichtigkeit als Spielaspekt nahezu ebenso hoch, gefolgt von den gemeinschaftlichen Aktivitäten in der Gilde. Hier bot Ultima Online etwas spezifisch Neues. Zum ersten Mal war es in einem Computer-Rollenspiel möglich, gemeinsam mit anderen eine grafisch komplexe virtuelle Welt mit bislang ungekannten Ausmaßen zu erkunden und zu erleben. Tendenziell nimmt - wie man in Abbildung 7 erkennt - die Wichtigkeit von Aspekten, die sich auf das soziale Erleben des Spiels beziehen, hin zu Aspekten, die mit individuellen Charakteristika der Spielfigur bzw. des Spielers zusammen hängen ab. Das Lösen von Rätseln, der Aufstieg in der Spielerhierarchie oder der Aspekt des Kampfes sind nur für weniger als ein Drittel der Spieler sehr wichtige Elemente des Spiels.

Abbildung 7: Wichtigkeit ausgewählter Spielaspekte

Dieses Ergebnis wird auch durch die Auswertung der offenen Frage "Was reizt dich an UO besonders?" bestätigt, zu der sich 92 % der Teilnehmer äußerten. Es dominieren mit etwa 70% der Antworten Aussagen, die die Bedeutung sozialer Aspekte wie die "hohe Interaktivität des Spiels", die Möglichkeiten zur "Kommunikation", "Freundschaften", das virtuelle "Leben in der Gilde", das sich bewegen in einer "virtuellen Welt" und das "Rollenspiel" für die Spieler betonen. Auf die eigene Spielfigur bezogene Möglichkeiten wie die Ansammlung von Vermögen werden nur von wenigen Spielern als Reiz des Spiels genannt.

Die 'Gesellschaft' der Spielfiguren - Makro- und Mesophänomene in Onlinespielen

Im folgenden wird die Untersuchungsperspektive gewechselt und das Augenmerk zunächst auf die Onlinewelt der Spielfiguren gelegt. Auch wenn die ?ußerungen der Spieler, ihnen sei die Entwicklung einer eigenen "Gesellschaft" besonders wichtig, differenziert betrachtet werden muss - es handelt sich letztlich um von den Spielern gesteuerte Figuren - so lassen sich doch auf der Ebene der Gesamtheit aller Figuren analog zur gesamtgesellschaftlichen Ebene in der Offline-Welt emergente Makrophänome untersuchen. Am einfachsten, da quantifizierbar, sei dies am Beispiel der Vermögensverteilung erläutert. Grundsätzlich ist diese Untersuchungsperspektive jedoch auch auf andere Makrokonstellationen übertragbar, die sich aus der Aggregation der Figureneigenschaften herleiten.

Alle Spieler beginnen mit dem gleichen Vermögen als Grundausstattung. Es stellt sich also die Frage, welche Verteilung sich nach einer mittleren Teilnahmedauer am Spiel von etwa 14 Monaten einstellt und welche Ursachen dies hat.

Die beobachtete Verteilung des Vermögens der Spieler, gemessen am Besitz von "Gold Pieces" ist extrem ungleich. Die 20% reichsten Figuren besitzen 83 % des gesamten Vermögens. Gleichermaßen verzerrte Verteilungen finden sich in der Offline-Welt in Schwellenländern wie Brasilien oder Südafrika (UNDP 1999). Eine naheliegende Erklärung dafür wäre, dass das Vermögen der Spieler mit der Teilnahmedauer zunimmt und damit die erhaltene Verteilung lediglich die unterschiedlich lange Teilnahme wiedergibt. Eine Untersuchung des Zusammenhangs zwischen Teilnahmedauer und Vermögen der Spielfigur zeigte jedoch, dass damit nur etwa 5 % der beobachteten Varianz in den Vermögen erklärt wird. Auch wenn man die Verteilung um die extrem hohen und wenigen "Ausreißer" bereinigt, kommt man für das darunter liegende Feld der Vermögenswerte nur zu 8 % erklärter Varianz. Die Teilnahmedauer alleine liefert also keine ausreichende Erklärung. Insbesondere für die Akquisition sehr hoher Vermögen scheint es andere Ursachen zu geben.

Einen Anhaltspunkt liefert die Untersuchung der sozialen Einbettung der Spielfiguren in der Spielwelt. Ebenso wie im Alltagsleben liegt die Hypothese nahe, dass Figuren mit exponierter Position innerhalb des Interaktionsnetzwerks verbesserten Zugang zu Ressourcen haben und durch Makler-Funktionen anderen verschlossene Profite abschöpfen können. Um nähere Auskünfte über die Vernetzung der Spielfiguren (entsprechend ihrer Interaktionen im Spiel) zu erhalten, wurden die Mitglieder der Gilde "Protectors of Moonglow" nach den Charakteren (Spielfiguren) gefragt, zu denen in UO regelmäßiger Kontakt besteht. Die genannten Beziehungen wurden schließlich zusammengefasst und in einen Graphen übertragen, der das soziale Netzwerk innerhalb der Gilde repräsentiert. Abbildung 8 zeigt das Netzwerk der Gilde und wurde um Nichtmitglieder an der Peripherie bereinigt, die im Zuge der Befragung auch als regelmäßige Kontaktfiguren genannt wurden.

Abbildung 8: Das Netzwerk der Gilde "Protectors of Moonglow"

Insgesamt lässt die Auswertung der jeweils genannten häufigen Kontaktfiguren den Schluss zu, dass für diese mit etwa 67 % die Gildenmitglieder dominieren. Die Gilde stellt demnach für die Mitglieder das wesentliche soziale Umfeld dar. In der Abbildung ist deutlich eine zentrale Spielfigur zu erkennen (a84), deren Position im Netz eine hohe Grad-Zentralität aufweist, d.h. die Figur verfügt über eine hohe Anzahl von Kontakten zu anderen Figuren. Die Figur a84 ist weiblich (männlicher Spieler) und verfügt über dreimal so viel Vermögen wie die zweitreichste Figur der Gilde. Interessant ist, dass diese Figur in der Gilde kein offizielles Amt bekleidet. Sie erweist sich dadurch vielmehr als "Strippenzieher" im Hintergrund. Eine etwas geringere, aber gegenüber den anderen Gildenmitgliedern noch vergleichsweise hohe Grad-Zentralität haben die Akteure a78, a80, a92, a114. Die Figur a78 ist ebenfalls weiblich (männlicher Spieler) und verfügt über ein durchschnittliches Vermögen. Als Gildenmeisterin nimmt Figur a78 ein zentrales, offizielles Amt ein. Der dazugehörige Spieler zeichnet für die Homepage der Gilde verantwortlich. Aus der Abbildung wird deutlich, dass die Figur a78 über gute Kontakte in fast alle Bereiche des Netzes verfügt. Figur a80 repräsentiert den Schatzmeister der Gilde, hat männliches Spielgeschlecht (ebenfalls männlicher Spieler), und verfügt nur über ein unterdurchschnittliches privates Vermögen. Die häufigsten Kontakte der Figur innerhalb UO sind - wie für einen "Schatzmeister" erwartet, sehr eng an die Kernclique des Netzes geknüpft. Die Figur a92 ist männlich (ebenfalls männlicher Spieler), verfügt über ein durchschnittliches Vermögen und bekleidet in der Gilde das offizielle Amt eines Beraters. a114 ist der Gilden-?lteste. Er hat "Zauberkräfte" und ist ein vergleichsweise guter Kämpfer. Es zeigt sich also, dass mit Ausnahme der Figur a84 alle zentralen Akteure des Netzwerks auch ?mter in der Gilde bekleiden. Das weit über dem Durchschnitt liegende Vermögen der Ausnahme-Figur a84 erhärtet die Ausgangshypothese, dass gutes "Networking" auch in der Onlinewelt zu Erfolg (vereinfacht gemessen am Besitz) verhilft.

Die Untersuchung ließe sich nun weiter ausdehnen auf die hinter den Figuren liegenden individuellen Eigenschaften der Spieler. Insbesondere liegt die Frage nahe, ob die soziale Positionierung der Figur im Spiel abhängig ist von der sozialen Positionierung des Spielers in der Offlinewelt, d.h. ob Dominanz in Offline-Gruppen mit einer Dominanz in Online-Gruppen korreliert ist oder, ob die gegenüber der Face-to-Face-Kommunikation restringierte Interaktion zu diesbezüglichen Verschiebungen führt. Wir lassen diese Frage für weitere Untersuchungen offen. MMPOGs bieten jedoch ein ideales Untersuchungsfeld um dieser Frage nachzugehen, die sich verallgemeinert auch in anderen computervermittelten Interaktionssituationen stellt.

Spielwelt und Alltagsleben

Die starke Interaktivität der Spieler von UO über ihre Spielfiguren, aber auch das Spiel begleitend über IRC und E-Mail, lassen eine Verschränkung der Spielerbeziehungen in der Online- und der Offline-Welt vermuten.

Die sozialen Beziehungen zwischen den Spielern von UO sind fast ausschließlich Beziehungen zwischen jungen Männern. Der Frauenanteil ist mit 3 % im Vergleich zum Durchschnitt aller Internetnutzer extrem gering. Gegenüber MUDs scheint in UO der Tausch von Geschlechterrollen im Spiel eine geringere Häufigkeit aufzuweisen. Ein derartiges "Genderswapping" ist in UO nur für 14 % der männlichen Spieler festzustellen bzw. für 12 % der Gesamtpopulation. Keine der wenigen Frauen spielte eine Figur männlichen Geschlechts. In einer Untersuchung von 199 MUD-Spielern aus 35 MUDs ergab sich ein Durchschnittswert von etwa 20 % der Spieler, die Online eine andere Geschlechterrolle annehmen (Mc Kenna, Lee 1996). Ultima Online stellt allerdings auch keine Mischwesen oder geschlechtslose Wesen zur Wahl.

Abbildung 9: Von den Spielern wahrgenommene Zusammenhänge zwischen sozialen Beziehungen in der Spielwelt und im Alltagsleben

Den Formen und dem jeweiligen Stellenwert, den die Spieler ihren Beziehungen beimessen, wurde im Rahmen der strukturierten Befragung nachgegangen. Abbildung 9 zeigt, dass den Spielern reine UO-Beziehungen weniger wichtig sind als Offline-Freundschaften. Auch schätzt nur ein geringer Teil der Spieler sein Sozialverhalten als durch das Spiel verändert ein. Nur 40 % möchten ihre Spielpartner auch Offline treffen. Andererseits haben die meisten Spieler in UO einen festen Kreis an Interaktionspartnern und geben an, in UO schneller und leichter jemanden kennen zu lernen als außerhalb davon. Die Tiefe dieser Beziehungen bzw. die emotionale Bindung hierbei wurde jedoch in der Befragung nicht weiter geprüft.

In einer offenen Frage zur beobachteten Veränderung des Sozialverhaltens durch das Spiel war ein häufig genannter Aspekt das reduzierte Zeitbudget für andere Aktivitäten und Hobbies. Viele gaben an, abends weniger auszugehen. Einige erklärten, dass der Kontakt zu Freunden, die nicht UO spielen, nachgelassen hätte. Dabei habe ausgleichend gewirkt, dass neue soziale Beziehungen hinzukamen, mit diesen Kontakten allerdings in vielen Fällen hauptsächlich über Ultima Online gesprochen wurde. Ein insgesamt atypisches aber dafür umso dramatischeres Bild der Veränderungen im Alltagsleben durch UO zeichnete ein Spieler im Rahmen eines offenen Interviews per Email:

" [...] Ich war von UO seit Anfang an begeistert. [...] Die ersten Kontakte mit UO waren, da ich auch noch in einem Internat war, sehr kurz. Als ich aber kurze Zeit später das Internat verließ und nach Hause (zu meinen Eltern) zog, wurde aus dem Teilzeitspaß, geradezu ein Fulltimejob, oder besser gesagt eine Sucht! Alles andere in meinem Leben kam zu kurz. Ich vernachlässigte meine eigentliche Arbeit, die Schule, andere Aktivitäten (wobei man hier sagen muss, dass ich zu Internatszeiten 5 mal die Woche Sport betrieben habe, und auf einmal so gut wie gar nicht mehr) und was am schlimmsten war: meine Freunde. Die hatte ich ja jetzt in UO, wobei die deutsche Szene damals noch sehr klein war. Ich saß wirklich ca. 10 Stunden pro Tag, am Wochenende sogar noch mehr vor dem Computer und habe gezockt. Mein einziger Ausweg war das Wechseln in ein neues Internat, in dem ich auch meinen Schulabschluss beendet habe. [...]"

Diskussion

Obwohl die Untersuchung ursprünglich nur als "fact finding mission" in die Spielwelt von Ultima Online vorgesehen war und sich die Ergebnisse der strukturierten Befragung auf ein Sample von nur etwa 100 Spielern beziehen, lassen sich doch durch Abgleich mit parallelen Untersuchungsmethoden belastbare Kernaussagen zusammenfassen:

  • Die Spieler von UO repräsentieren insbesondere hinsichtlich Alter, Geschlechterverhältnis und Nutzungsintensität eine vom Durchschnitt der Internet-Nutzer deutlich verschiedene Untergruppe. Sie ist jünger, dominant männlich und ist deutlich öfter und länger im Internet.
  • Wesentlich für die Motivation zum Spiel ist das soziale Erleben der verteilten virtuellen Umgebung. Die Herausbildung sozialer Formationen mit einer zeitlichen Stabilität über eine "Session" hinaus wird dabei durch die vom Hersteller vorgesehenen Interaktionsmöglichkeiten begünstigt.
  • Auf der "gesamtgesellschaftlichen" Ebene der Spielfiguren lassen sich Makrophänomene wie etwa die Verteilung von Besitz feststellen, die auf das Zusammenwirken der individuellen Aktionen der Spielfiguren zurückzuführen sind. Diese wiederum sind Folgen unterschiedlicher Strategien der Spieler.
  • Die neu geknüpften Beziehungen in UO ersetzen keine Offline-Freundschaften. Vielmehr wird der durch das Spiel induzierte Mangel an anderweitig verbrachter Freizeit bei starken Spielern als Belastung empfunden. Von den Spielern wird ein qualitativer Unterschied zwischen den sozialen Beziehungen im Alltagsleben und reinen UO-Kontakten wahrgenommen, da sich für letztere die Kommunikationsinhalte überwiegend auf die gemeinsam erfahrene Welt von UO beschränken. Die Selbsteinschätzung, dass sich durch das Spiel das Sozialverhalten insgesamt deutlich geändert habe, ist allerdings die Ausnahme.

Multiplayer-Onlinespiele wie UO bleiben ein lohnender Gegenstand für weitere Untersuchungen:

  • Durch die grafische Repräsentation der Spieler in den Spielfiguren scheint eine gegenüber rein textbasierten Kommunikationsumgebungen stärkere Verschränkung von Offline- und Online-Beziehungen vorzuliegen. Prozesse der Gemeinschaftsbildung in und um das Internet sollten in diesem Fall deutlicher beobachtbar und damit leichter analysierbar sein.
  • Spiele wie UO liegen auf halbem Wege zwischen dem Untersuchungsgegenstand klassischer sozialwissenschaftlicher Forschung und vollständig simulierten "artificial societies" (vgl. Epstein und Axtell 1996). Einschränkungen wie die methodischen Schwierigkeiten durch die Störung der physischen Präsenz des Beobachters im ersten Fall und die Fragwürdigkeit der Übertragung der Ergebnisse auf die reale Welt für letztere sind bei den teilsimulierten "Gesellschaften" von MMPOGs deutlich abgeschwächt. MPOGs stellen damit einen qualitativ neuen Gegenstand sozialwissenschaftlicher Forschung mit Potential für auch darüber hinausweisende Erkenntnisse dar.

Literatur

ARD/ZDF-Arbeitsgruppe Multimedia (2000): ARD/ZDF-Online-Studie 2000: Gebrauchswert entscheidet über Internetnutzung in: Media Perspektiven 8/2000, S. 338-349

Baur, Timo (2000): Virtuelles Britannia: Eine Feldstudie in der virtuellen Realität, unveröffentlichtes Manuskript, Ludwig-Maximilians-Universität München

Berger, Andreas (1999): Spiel mit den Leben, Eine deskriptive und qualitative Analyse des Multiuserdungeons "Ultima Online", Wien [Online: http://www.univie.ac.at/Publizistik/mud/andreas1.htm]

Breeze, Mary-Anne (1997): Quake-ing my boots:<<Examining>>clan:community< construction in an online gamer population, in: Cybersociology Magazine Issue Two: Feature Article [Online: http://www.socio.demon.co.uk/magazine/magazine.html]

Epstein J, Axtell R. (1995): Growing Artificial Societies: social science from the bottom up, Brookings Institution Press, Washington

GFK (2001): GFK Online-Monitor 7.Welle

Mc Kenna, Lee (1996): A Love Affair with MUDs: Flow and Social Interaction in Multi-UserDungeons, Ohio, USA [Online: http://oak.cats.ohiou.edu/~sl302186/MUD1.HTM]

Miller D., Slater D. (2000): The Internet, An Ethnographic Approach, Berg, Oxford, New York

Reid, Elizabeth M. (1994): Cultural Formations in Text-Based Virtual Realities, Master's Thesis, Melbourne, Australia. 1994 [Online: http://home.earthlink.net/~aluluei/cult-form.htm]

Schweizer, Thomas (1996): Netzwerkanalyse als Fundament der Sozialethnologie, Reimer, Berlin

Simpson, Zachary B. (1999): The In-Game Economics of Ultima Online, Onlinepublikation [Online: http://www.totempole.net/uoecon/uoecon.html]

UNDP (1999), World Inequality Database, United Nations Development Programme, The United Nations University


Bauss, Anne-Katrin ; Jonas, Kai; Sassenberg, Kai; Boos, Margarete Institution: Georg-August-Universität Göttingen
Article (version: 25/06/2002 - 07:47, size: 12936)
"Entwicklung und Evaluation eines Online-E-Mail-Trainings."
German:

Entwicklung und Evaluation eines Online-E-Mail-Trainings

Anne-Katrin Bauß, Kai J. Jonas, Kai Sassenberg & Margarete Boos

Georg-August-Universität Göttingen

Elektronische Post (engl. Electronic Mail, abgekürzt E-Mail) wird immer mehr zur organisationsinternen sowie -externen Kommunikation genutzt: Serviceleistungen und Produktanfragen spielen dabei ebenso eine Rolle wie internet- oder intranetbasierte Mailinglisten.

E-Mail-Handbücher (z.B. Lutz & Schwertner, 1999, Flynn & Flynn, 1999) wie auch psychologische Untersuchungen zur Aneignungen neuer Kommunikationstechniken in Organisationen (z.B. Wiest, 1994) zeigen jedoch, daß das Schreiben von E-Mails Techniken und Kenntnisse - kurz Medienkompetenz - erfordert, die nicht von vornherein gegeben sind. Viele Mitarbeiterinnen und Mitarbeiter, die bisher noch keinen Kontakt mit den sogenannen "Neuen Medien" hatten fühlen sich anfangs schnell überfordert. Eine effiziente Nutzung von E-Mail ist somit nicht gewährleistet.

Zwar erfolgt in manchen Unternehmen bei der Einführung von E-Mail eine kurze Einweisung. Diese beinhaltet meist aber nur technische Details und läßt konkrete E-Mail-Kommunikationstips außer acht. Am Beispiel der sogenannten Netiquette - den empfohlenen Verhaltensregeln im Netz - zeigt sich jedoch, daß erfolgreiche Netzkommunikation nicht auf den Erwerb technischer Kompetenz beschränkt ist, sondern zusätzlich soziale Kompetenz und Sachkenntnis erfordert. Da die bisher vorliegenden E-Mail-Trainings soziale Aspekte sowie spezifische Empfehlungen bei der Nutzung von E-Mail am Arbeitsplatz eher vernachlässigen, wurde in der folgenden Studie ein E-Mail-Kommunikationstraining speziell für den Arbeitsalltag konzipiert.


Entwicklung eines Online-E-Mail-Trainings

Neben alltäglichen Fragen, Problemen und Empfehlungen im Bereich E-Mail, die E-Mail-Praxisbüchern zu entnehmen waren (z.B. Flynn & Flynn, 1999; Schätzlein & Deutscher, 1998), basierten die Trainingsinhalte auf sechs Theorien bzw. Modellen zur computervermittelten Kommunikation (zusammengefaßt aus Döring, 1999, z.B. Theorie der sozialen Reizreduktion, Sproull & Kiesler, 1986; Theorie sozialer Informationsverarbeitung, Walther, 1992) und dem Verständlichkeitskonzept von Langer, Schulz von Thun & Tausch (1990). Zur Trainingsgliederung wurde das Modell "Vier Seiten einer Nachricht" (Schulz von Thun, 1981) herangezogen.

Das Internet bietet in Form von Online- bzw. sogenannten virtuellen Trainings eine neue, mit vielen Vorteilen verbundene Form des Lehrens und Lernens (Scheuermann, 1998). Zeitliche und räumliche Flexibilität sowie eine nahezu unbegrenzte Teilnehmerinnen- und Teilnehmerzahl sind typische Merkmale dieser Weiterbildungsform. Da gleichzeitig der Umgang mit den neuen Informations- und Kommunikationstechnologien geübt wird, erschien die virtuelle Vermittlungsform beim E-Mail-Training als Methode der Wahl.


Inhalte und Ablauf des Trainings

Inhalte des Trainings waren Empfehlungen zur formalen Gestaltung einer E-Mail (z.B. begrenzte Verwendung von Akronymen, optimale Länge einer E-Mail, empfehlenswerte Gliederung einer E-Mail, Verwendung einer aussagekräftigen Betreffzeile), gefolgt von Anmerkungen über den "emotionalen" Inhalt einer E-Mail (z.B. Flaming, Wirkung von Großbuchstaben in E-Mails) sowie Hinweisen zur optimalen Selbstdarstellung via E-Mail (Erstellen einer Signatur, Aussagekraft der Kopfzeilen). Abschließend wurde im Rahmen der Erörterung der Vor- und Nachteile von E-Mail (z.B. Sicherheitsaspekt, Versenden von Dateien als Attachment, Weiterleiten einer Nachricht u.a.) der Aspekt der Medienwahl berücksichtigt.

Die Teilnehmerinnen und Teilnehmer kommunizierten ausschließlich asynchron textbasiert via E-Mail mit der E-Mail-Trainerin. Während des gesamten Trainingszeitraums waren zwölf Trainingseinheiten zu bearbeiten, die im Intranet bzw. Internet einzusehen waren und deren antizipierte Bearbeitungsdauer bei 15 min lag. Die Trainingseinheiten endeten mit einer Übungsaufgabe, deren Lösungsvorschlag die Teilnehmerinnen und Teilnehmer der Trainerin per E-Mail zuschickten. Darauf folgte ein halbstandardisiertes E-Mail-Feedback, welches neben der Aufgabenlösung einen Hyperlink zur nächsten Trainingseinheit beinhaltete.


Evaluation des Online-E-Mail-Trainings

Ziel der Evaluation war eine Überprüfung der Wirksamkeit und Akzeptanz des Online-E-Mail-Trainings. 46 Teilnehmerinnen und Teilnehmer aus zwei Institutionen nahmen an der Evaluation im Zeitraum von Ende Mai bis Ende August 2000 teil. Zur Überprüfung der Hypothese, daß das E-Mail-Training eine Erhöhung der objektiven Medienkompetenz bewirkt, wurde die Hälfte der Teilnehmerinnen und Teilnehmer zunächst als Vergleichsgruppe nicht trainiert.

Zwei E-Mail-Wissenstests, die zu verschiedenen Meßzeitpunkten bearbeitet wurden, dienten der Einschätzung der objektiven Medienkompetenz als Kriterium für den objektiven Lernerfolg. Die Trainingsgruppe bearbeitete jeweils vor und nach dem Training einen Wissenstest. Die Vergleichsgruppe erhielt die Tests in einem Abstand von zwei Wochen, der als optimale Trainingsdauer antizipiert worden war. Bei den E-Mail-Wissenstests handelte es sich um zwei fiktive E-Mails, in denen zwölf typische inhaltliche, stilistische und formale E-Mail-Fehler enthalten und von den Teilnehmerinnen und Teilnehmern zu identifizieren waren.

Zu Beginn und am Ende des Trainings wurden außerdem jeweils Daten mittels Fragebögen erhoben. Diese konnten online ausgefüllt werden. Zu Beginn des Trainings wurde die subjektive Medienkompetenz, die Motive für die Teilnahme, die Erwartungen an das Training sowie soziodemographische Daten erfaßt. Der zweite Fragebogen nach dem Training enthielt Fragen zum Grad der Erwartungserfüllung, zur Gestaltung des Trainings, technischen Problemen, der Zufriedenheit mit einzelnen Trainingsinhalten sowie dem subjektiven Lernerfolg.


Ergebnisse

Objektiver und subjektiver Lernerfolg

Hinsichtlich des objektiven Lernerfolgs ergaben sich deutliche Unterschiede in der objektiven Medienkompetenz vor und nach dem E-Mail-Training. Die Teilnehmerinnen und Teilnehmer der Trainingsgruppe (n=23) wiesen im E-Mail-Wissenstest nach dem Training eine signifikant höhere objektive Medienkompetenz auf als vor dem E-Mail-Training (M1= 5.26; SD1 = 2.18; t (22) = 8.535; p < .001).

Zudem erhöhten sie ihre objektive Medienkompetenz zwischen den zwei Meßzeitpunkten signifikant stärker als die nicht trainierte Vergleichsgruppe (M3 = 0.22; SD3 = 1.57 und M4 = 3.70; SD4 = 2.08; t (44) = 6.414, p < .001).

Der durchschnittliche subjektive Lernerfolg aller Teilnehmerinnen und Teilnehmer, die das Training vollständig bearbeitet hatten (n=36) betrug auf einer sechsstufigen Ratingskala (1 = sehr niedrig, 6 = sehr hoch) einen Mittelwert von 4.03 (SD=0.97).

Reaktionen auf das Training

Die durchschnittliche subjektive Medienkompetenz aller 46 Beteiligten betrug zu Beginn des Trainings auf einer sechsstufigen Ratingskala (1 = keine Erfahrung, 6 = sehr viel Erfahrung) einen Mittelwert von 2.62 (SD = 0.79). Dabei fiel auf, daß das theoretische Vorwissen im Bereich Internet/E-Mail aus Internet-Einführungskursen und eigener Lektüre besonders gering eingestuft wurde, was die Wichtigkeit eines E-Mail-Trainings unterstreicht.

Dementsprechend hoch fiel die intrinsische (M = 4.96, SD = 0.90) und extrinsische Motivation (M = 3.48, SD = 1.33) zur Teilnahme am Training aus.

Besonders positiv bewerteten die Teilnehmerinnen und Teilnehmer den virtuellen Ablauf, der die zeitliche und räumliche Flexibilität des Trainingsablaufs ermöglichte. Auch die individuelle Betreuung sowie die übersichtliche Gliederung und abwechslungsreiche Gestaltung der Trainingsseiten fanden großen Anklang.

Lediglich zwei der zwölf Übungen sowie die zu antizipierende Bearbeitungsdauer der einzelnen Trainingseinheiten wurden von den Teilnehmerinnen und Teilnehmern als veränderungswürdig bewertet. Anmerkungen von Teilnehmerinnen und Teilnehmern zur Bearbeitungsdauer der einzelnen Trainingseinheiten verdeutlichen, daß die antizipierte Dauer von 10-15 auf 20 bis 30 min erhöht werden sollte. Die durchschnittliche Trainingsdauer von 23.17 Tagen (SD = 12.46) spricht auch für die Anhebung der zu antizipierenden Bearbeitungsdauer für das gesamte Training. Die Trainingsdauer schwankte dabei zwischen einer sehr kurzen Bearbeitungsdauer von drei Tagen bei zwei Personen und einer maximalen Dauer von 50 Tagen bei einer anderen Person.

Diskussion

Die klassische Wirkungsanalyse, die sich mit dem objektiven, trainingsbedingten Lernerfolg - der Erhöhung der objektiven Medienkompetenz - befaßt, wurde in der vorliegenden Evaluation um eine Analyse des subjektiven Lernerfolgs ergänzt. Dieser war zu entnehmen, daß die Teilnehmerinnen und Teilnehmer ihren subjektiven Lernerfolg nach dem E-Mail-Training durchgehend als sehr hoch empfanden. Es kann angenommen werden, daß vor allem das subjektive Empfinden der Teilnehmerinnen und Teilnehmer, durch das Training einige neue Kenntnisse im Bereich E-Mail gewonnen zu haben, ihr Interesse an der Nutzung von E-Mail fördern und ihre Sicherheit im Umgang mit dem neuen Medium erhöhen kann. Ein Ziel des E-Mail-Trainings, die anfängliche Überforderung der Mitarbeiterinnen und Mitarbeiter mit dem neuen Medium E-Mail am Arbeitsplatz zu verringern, kann somit als erreicht angesehen werden. Diese positive Wirkung des E-Mail-Trainings, die aus den Bewertungen des subjektiven Lernerfolgs und der positiven Reaktionen auf das Training hervorging, wird gleichzeitig unterstrichen durch den objektiven Lernerfolg der Teilnehmerinnen und Teilnehmer, der aus den zwei Wissenstests hervorging..

Für die Weiterentwicklung des Trainings kann aus den Erfahrungen dieser Studie abgeleitet werden, daß vor allem die zu antizipierende Bearbeitungsdauer der einzelnen Trainingseinheiten von ursprünglich 15 min auf 20 bis 30 min erhöht werden sollte. Zu berücksichtigen ist dabei vor allem die zu Beginn nötige Eingewöhnungszeit an die Techniknutzung und die virtuelle Lernumgebung, mit der die Mehrzahl der Teilnehmerinnen und Teilnehmer aus dieser Studie nach eigener Einschätzung bisher kaum Erfahrung hatte. Außerdem erscheint die Kombination des virtuellen Vermittlungsform mit einer herkömmlichen Einführungsveranstaltung zum Kennenlernen der Trainerin sowie .dem Abklären von technischen Fragen vorteilhaft, um die gewisse Anonymität beim ausschließlich asynchron textbasiert ablaufenden Training zu verringern.


Literaturangaben:

Döring, N. (1999). Sozialpsychologie des Internet: die Bedeutung des Internet für Kommunikationsprozesse, Identitäten, soziale Beziehungen und Gruppen. Göttingen: Hogrefe.

Flynn, N. & Flynn, T. (1999). Professionelle E-Mails: Schreiben, Texten, Gestalten und Verwalten. Wien: Ueberreuter.

Langer, I., Schulz von Thun, F. & Tausch, R. (1999). Sich verständlich ausdrücken (6. Aufl.). München: Reinhard.

Schätzlein, E. & Deutscher, E. (1998). Praxisbuch Geschäftsbriefe. Effizient und kundenorientiert schreiben. Brief, Fax und E-Mail: Analysen und Verbesserungsvorschläge. Niedernhausen/TS.: Falken.

Schulz von Thun, F. (1981). Miteinander reden: Störungen und Klärungen: Psychologie der zwischenmenschlichen Kommunikation. Reinbek bei Hamburg: Rowohlt.

Wiest, G. (1994). Computergestützte Kommunikation am Arbeitsplatz. Die Aneignung neuer Kommunikationstechniken in Organisationen am Beispiel von Electronic Mail. Weiden: Schuch.


Boos, Margarete ; Institution: Georg-Elias-Müller-Institut für Psychologie, Georg-August-Universität Göttingen
Article preliminary article (version: 25/06/2002 - 07:47, size: 529)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Computervermittelte Kommunikation in Organisationen"


Boudourides, Moses A. ; Institution: Computer Technology Institute and Department of Mathematics, University of Patras
Article (version: 25/06/2002 - 07:47, size: 29131)
"New Directions of Internet Research."
German:

1. Introduction

Internet research (Jones, 1999) is recently concentrating the interest of many scholars not only because of the ubiquitousness of this new medium. Some, as Paccagnella (1997), hope that these studies could transcend the traditional quality/quantity divide in social research (cf., Miles & Huberman, 1994, pp. 40-43). In fact, the idea of an interpretive social science combined with statistical methods is not new at all. For instance, Max Weber (1949 [1922]) advocated the interplay between explanation (Erklären) and understanding (Verstehen). More recently, Pierre Bourdieu has made extensive use of correspondence analysis because the latter as a relational technique of data analysis corresponds exactly to what, in his view, “the reality of the social world is” and “it is a technique which ‘thinks’ in terms of relation” (Bourdieu & Wacquant, 1992, p. 96).

In the sequel, we intend to overview three different approaches (social network analysis, ethnography and chaos theory) and exhibit some examples of their contributions to Internet research.

2. Social Network Analysis

A social network is a set of actors and relations occurring among them. Actors can be individual people, objects or events as far as certain relations hold them all together; actors can be also aggregate units such as organizations, institutions, communities, groups, families etc. The very idea of the social network approach is that relations or interactions between actors are the building blocks or the key factors that sustain and define the network (Wellman, 1988; Wasserman & Faust, 1994). Typically interactions between actors result from exchange of resources, either material or informational, such as goods, money, information, services, social or emotional support, trust, influence etc. Each kind of resource exchange is considered a social network relation and actors maintaining the relation are said to maintain a tie. The strength of a tie may range from weak to strong depending on the quantity, quality and frequency of the exchanges between actors (Marsden & Campbell, 1984). Patterns of who is tied to whom reveal the structure of the underlying network: they show how resources flow among actors and how actors are interconnected in the network. A few very well known examples of social network analyses are: Granovetter (1973, 1974) who investigated exchange of job information among acquaintances and found that weak ties are quite operationally strong for the diffusion of such information. Wilson (1997) found that the urban poor in isolated Black ghettoes lack connections with sources of work. Burt (1992) studied the dependency of social capital on ‘structural holes’ (which are particular kinds of network positioning in which a focal actor is connected to other actors which themselves are not connected with one another); thus, according to Burt, social capital is not a direct attribute of actors but rather of their ability to sustain flexible configurations within a network.

Now, computer networks in general and in particular the Internet are clearly social networks (Wellman et al., 1996). In these social networks, actors may be human, such as users, communicants, information producers and consumers, citizens, public or market organizations etc., or non-human, such as computer machines, information databases, (hyper-) documents, multimedia resources etc. Relations among the human Internet actors refer to informative and communicative uses, access, provision, procurement, commerce, work, education etc. Although human actors are always beneath the non-human ones, typical relations among the latter consist of information (data) flows, traffic, exchanges of e-mails and postings in web pages, links, connections, network topologies etc.

In this way, there are applications of social network analysis to study the Internet such as: Garton, Haythornthwaite and Wellman (1999) tried to assess the role of e-mail and desktop videoconferencing within the context of overall communication. Haythornthwaite (2000) collected data from four computer-supported distance-learning classes in order to build a picture of the size and composition of personal online networks. Haythornthwaite (2001) has studied the strength of interpersonal ties among new media communicants arguing that, when the medium changes, weak ties are more vulnerable to dissolution while strong ties remain more robust.

As another example, we will refer to the work currently done in the 5th FP IST-Eurostat project EICSTES (‘European Indicators, Cyberspace and the Science-Technology-Economy System’). Among other data (collected by automatic intelligent agents scanning various Search Engines), we are measuring the number of links among almost all of the University sites in the 15 EU countries: Austria (at), Belgium (be), Denmark (dk), Finland (fi), France (fr), Germany (de), Greece (gr), Ireland (ie), Italy (it), Luxembourg (lu), the Netherlands (nl), Portugal (pt), Spain (es), Sweden (su) and UK (uk). The following two sociograms show the relational positioning of the EU countries according to the incoming and outgoing links of their University sites, respectively (obtained by MDS while the clustering in groups of countries has resulted by SPSS factor analysis):

Incoming links:

outgoing links





Another application of social network analysis to the Internet concerns the communicative activities of the members of a mailing list. The motivation of this application comes from the fact that social network analysis can not only simplify the complex interpersonal connections in various social networks but it can also aid in investigating conspiratorial crime (Davis, 1981).

As an example, let us consider the members of a mailing list who, by exchanging e-mails, participate in multiple threads of discussions. By processing the archives of the mailing list, we can extract data on the members’ participations in such threads of messages and from these data we can derive the corresponding sociograms of interactions among the mailing list members. In such networks, the proximity between nodes (representing participants) is manifesting the extent of their interaction through their participation in a large number of common threads of discussions. On the other side, a possible divergence or isolation of certain nodes (participants) will indicate their reluctance to interact within the group of recipients of the mailing list.

For instance, we have applied the above ideas to the mailing list COMMORG, in which the discussions were about a 5th FP IST programme. The communicants in the mailing list were grouped according to the location of the participant institution at the project: Rome (coordinator), Milan, Patras, Amsterdam, Nijmegen, Manchester and Surrey. The following sociogram maps the relational positioning of communicants according to their interactions in the mailing list through their participation in threads of messages (obtained by MDS and the clustering in two groups having resulted by SPSS factor analysis):



3. Ethnography

Let us first start with a very short outline of ethnography. At the heart of ethnographic methods lies the ‘reflexive turn’ in anthropology and sociology, “based upon the human capacity for participant observation and the capability for reflecting upon it” (Titscher et al., 2000, p. 91). “We act in the social world and yet are able to reflect upon ourselves and our actions as objects in that world” (Hammersley & Atkinson, 1995, p.25). In particular, ethnography analyzes human practices in the context of culture. Culture “denotes an historically transmitted pattern of meanings embodied in symbols, a system of inherited conceptions expressed in symbolic forms by means of which men communicate, perpetuate and develop their knowledge about and attitudes towards life” (Geertz, 1979, p. 89).

So, doing ethnography “in its most characteristic form [it] involves the ethnographer participating, overtly and covertly, in people’s daily lives for an extended period of time, watching what happens, listening to what is said, asking questions – in fact, collecting whatever data are available to throw light on the issues that are the focus of the research” (Hammersley & Atkinson, 1995, p. 1). In this way, ethnographic methods are trying to interpret data (such as texts) extracted from the flow of social discourse against the background of cultural structures. “Doing ethnography is like trying to read (in the sense of ‘construct a reading of’) a manuscript […] written not in conventionalized graphs of sound but in transient examples of shaped behavior” (Geertz, 1973, p. 10). At the same time, ethnographic analyses are concerned with using their data in order to attain a reconstruction of key events in social discourse, a disclosure of emergent cultural patterns. For the visualization of these patterns it is often suggested that “maps, flowcharts and matrices of these patterns all help to crystallize and display consolidated information” (Fetterman, 1989, p. 95). However, we need to stress that, in ethnographic studies, data analysis is not a separable phase from data collection, as a dialectic interplay between them is commonly postulated (Hammersley & Atkinson, 1995, p. 205).

Now, it should be mentioned that the heterogeneity of ethnographical studies has made ethnography to appear as “one of those catchall words whose meaning is extremely general and vague” (Harper, 1999, p. 241). Two representative examples of classical ethnographical research are Goffman’s studies of how inmates in an asylum deal with their predicament through personal and social habits (Goffman, 1959, 1961); and Skolnick’s study of the way police officers are compromised by tensions between ‘due processes’ and what they perceive as ‘moral justice’ in their dealings with criminals (Skolnick, 1966).

Furthermore, various hybrid approaches (combining ethnography, audience research, discourse analysis, textual analysis, autobiography etc.) have been and are applied to online analyses of the Internet and cyberculture. As a matter of fact, the Internet provides easily and inexpensively a plethora of digital data (from logs, messages and links to online interviews, surveys and polling) in order to develop longitudinal strategies of research comparing virtual life, communities and patterns over different periods of time and different geographical, social or cultural contexts. In this way, investigating the new ethnography required by the Internet (the ‘virtual ethnography’), Christine Hine (2000) is led to rethink traditional ways of studying ‘culture’ and ‘society.’

Some examples of ethnographic-type analyses of the Internet are: Paccagnella (1997) who studied as a participant observer the Italian virtual community named cyber_punk hosted by a non-profit BBS network over a period of 18 months. Denzin (1999) who tried to interpret the gendered ‘narratives of self’ in a newsgroup focusing on recovery from alcoholism. Rodino (1997) who observed the multiple and even contradictory ways of performing gender on an IRC channel. Baym (1995, 1998, 2000) who conducted a three-year study of the newsgroup rec.arts.tv.soap devoted to the recreational discussion of daytime soap operas. McLaughlin, Osborne and Smith (1995) who collected all articles posted in five newsgroups for three weeks in 1993 and analyzed episodes of normative discourse such as remedial or corrective sequences generated by an unacceptable post/reply or habitual pattern of the same communicant. Tepper (1997) who analyzed the use of humor as a policing mechanism on the newsgroup alt.folklore.urban. Hine (2000) who performed an ethnographic analysis of the Louise Woodward case, a teenage British nanny tried in Boston for the murder of a child who had been in her care. Branwyn (1994) who studied cybersex. Correll (1995) who observed a lesbian net café. Dibbell (1994) who gave an autobiographical account of a rape scenario played on a LambdaMoo. Markham (1998) who conducted online interviews in order to research real experiences in virtual spaces. Argyle (1966) who explored her own reactions to the death of a mailing list member to which she was participating, whom she had never met. Aycock and Buchignani (1995) who created some fictional reflections on the online activities of somebody who subsequently murdered four people at Concordia University in 1992.

4. Chaos Theory Analysis

In this section we will present the results on a chaotic time series analysis of ‘ping’ data that we have obtained in the project SOEIS (‘Self-Organization of the European Information Society’). Here, the Internet data come from the ‘symbolic-representational’ character of digital information flows on the Internet. Apparently, these data are semantically context-free in the tradition of Shannon and Weaver’s classical communication theory.

More specifically, one way to estimate the traffic on the Internet is by measuring the round-trip times for ICMP ping packets sent from one host to a second one. In this way, we obtain a time series (herein called ‘ping time series’), which we process through linear statistical methods and methods of chaotic non-linear analysis. Thus, we may investigate whether certain patterns emerge, i.e., there exists some kind of structure in the data, or the data are completely random, such as, e.g., the outcome of a random number generator. Certainly, one expects that, if any, the underlying mechanism is a complicated one that cannot be identified using the classical statistical tools, such as autocorrelation and Fourier spectrum analyses. (General literature on the field: Kay, 1988, Priestley, 1988, Tsonis, 1992.)

In our work (Kugiumtzis & Boudourides, 1998) we examined a specific time series composed of ping times in between two hosts, one at the Democritus University of Thrace in Greece and the other at the University of California at Irvine in USA.



This ping time series (measured at the scale of 15 sec) was following a repeated pattern, composed of a background, corresponding to a subsided Internet traffic, and succeeded by a sudden peak, corresponding to a short congestion period of the order of a minute or less. In the measured set of round trip times, a data window of larger magnitude was detected corresponding to a large congestion period of more than half an hour, during which the net was overloaded. The presence of this data window introduced nonstationarity and, therefore, it altered the results of some of the applied methods. Particularly, the inclusion of the long congestion period resulted substantially larger estimated linear correlations over many lags, which was apparently a misleading result. Nevertheless, removing the long congestion period, no correlation was detected. Moreover, the False Nearest Neighbors method suggested erroneously that there was more structure in the long congestion period data.

The findings of the applied methods have not given any definite evidence whether the ping data were simply white noise or not. Obviously, the data was following a nonsymmetrical distribution resembling the lognormal distribution and, so, the data was not white noise of a Gaussian or uniform type. Some methods, such as the estimation of the autocorrelation, mutual information and correlation dimension, suggested that there was no correlation and structure in the ping data. On the other hand, the prediction with Autoregressive models and the Local Linear Prediction, as well as the Largest Lyapunov Exponent method, indicated that there were small correlations and some structure in the data, as they have given different results than those expected for the white noise case.

5. Conclusions

Although the Internet is a network, the well known ‘identity fluidity’ in it (Jordan, 1999) undoubtedly contrasts its rigid structural modality. As a matter of fact, all social networks suffer a similar theoretical vacillation. According to a common criticism of social network analysis, the latter is imputed on its static structuralism, which is incapable to grasp the dynamic and transformative attributes of human agency (Emirbayer & Goodwin, 1994; Emirbayer & Mische, 1998). Social action is the key concept to assist a theoretical understanding of the interplay between structural relations and discursive processes, i.e., social network analyses and ethnographic studies. Because “social action is interaction that induces interpretations and thus builds continuing relations” (Mische & White, 1998, p. 695).

One of the ways that has been suggested to achieve a commingling of ‘conversations and situations’ is by conducting a paradigm shift, an exploration of new operational metaphors to describe social topologies (Urry, 2000, 31, 38-39). From the network paradigm, grounded in an imagery of atomic particles, it has been suggested to pass to the flow paradigm, grounded on an imagery of fluids, where “neither boundaries nor relations mark the difference between one place and another; instead, sometimes boundaries come and go, allow leakage or disappear altogether, while relations transform themselves without fracture” (Mol & Law, 1994, p. 643).

Such a ‘phase transition’ (a liquidation of solid structures) is assumed to be produced by two interacting kinds of uncertainty (White, 1992, pp. 102-115). On the one side, there is ambiguity, designating uncertainty in purely cultural context. On the other side, there is what Harrison White calls ‘ambage,’ designating uncertainty in purely social-structural contexts. Ambiguity is about fuzzy meanings and interpretations while ambage “concerns the concrete world of social ties, in networks of ties and corporates among nodes” (p. 107).

According to White, “A polymer gel is more like social networks. These very long molecules reptate through messy, inhomogeneous environments which include other such chains and induce new ties” (p. 70). “We are creatures living within social goos, shards, and rubbery gels made up by and of ourselves” (p. 337).

The above metaphors designate some possible future directions towards which social networks might develop in order to synthesize adequately social structural and cultural analyses and to reconcile the structure/agency (or social topology/dynamics) dichotomy. It is interesting that, by highlighting processes of uncertain interactions and dynamic social change, these directions appear to approach the fractal landscapes of nonlinear dynamics and complex systems by following certain precipitous non-Euclidean sticky pathways.

References

[1] Argyle, K. (1996). Life after death. In R. Shields (ed.), Cultures of Internet: Virtual Spaces, Real Histories, Living Bodies, pp. 133-142. Thousand Oaks, CA: Sage.

[2] Aycock, A., & Buchignani, N. (1995). The e-mail murders: Reflections on “dead” letters. In S.G. Jones (ed.), CyberSociety: Computer-Mediated Communication and Community, pp. 184-231. Thousand Oaks, CA: Sage.

[3] Baym, N.K. (1995). The emergence of community in computer-mediated communication. In S.G. Jones (ed.), CyberSociety: Computer-Mediated Communication and Community, pp. 138-163. Thousand Oaks, CA: Sage.

[4] Baym, N.K. (1998). The emergence of on-line community. In S.G. Jones (ed.), CyberSociety 2.0: Revisiting Computer-Mediated Communication and Community, pp. 35-68. Thousand Oaks, CA: Sage.

[5] Baym, N.K. (2000). Tune In, Log On: Soaps, Fandom, and Online Community. Thousand Oaks, CA: Sage.

[6] Bourdieu, P., & Wacquant, L.J.D. (1992). An Invitation to Reflexive Sociology. Cambridge, UK: Polity Press.

[7] Branwyn, G. (1994). Compu-sex: Erotica for cybernauts. In M. Dery (ed.), Flame Wars: The Discourse of Cyberculture, pp. 223-236. Durham, NC: Duke University Press.

[8] Burt, R. (1992). Structural Holes. Chicago: Chicago University Press.

[9] Callon, M. (1986). The sociology of an actor network. In M. Callon, J. Law & A. Rip (eds.), Mapping the Dynamics of Science and Technology. London: Macmillan.

[10] Callon, M., & Courtial, J.-P. (1997). Using scientometrics for evaluation. In M. Callon, P. Larédo & P. Mustar (eds.), The Strategic Management of Research and Technology: Evaluation of Programmes, pp. 165-219. Paris: Economica International.

[11] Collins, H.M. (1994). Bruno Latour: We Have Never Been Modern. Isis, vol. 85, no. 4, pp. 672-674.

[12] Correll, S. (1995). The ethnography of an electronic bar: The lesbian café. Journal of Contemporary Ethnography, vol 24, no. 3, pp. 270-298.

[13] Davis, R.H. (1981). Social network analysis: An aid in conspiracy investigations. FBI Law Enforcement Bulletin, vol. 50, no. 12, pp. 11-19.

[14] Denzin, N. (1999). Cybertalk and the method of instances. In S.G. Jones (ed.), Doing Internet Research: Critical Issues and Methods for Examining the Net, pp. 107-125. Thousand Oaks, CA: Sage.

[15] Dibbell`, J. (1994). A rape in cyberspace: Or, how an evil clown, a Haitian trickster spirit, two wizards, and a cast of dozens turned a database into a society. In M. Dery (ed.), Flame Wars: The Discourse of Cyberculture, pp. 237-261. Durham, NC: Duke University Press.

[16] Emirbayer, M., & Goodwin, J. (1994). Network analysis, culture, and the problem of agency. American Journal of Sociology, vol. 99, pp. 1411-1454.

[17] Emirbayer, M., & Mische, A. (1998). What is agency? American Journal of Sociology, vol. 103, pp. 962-1023.

[18] Fetterman, D.M. (1989). Ethnography Step by Step. Newbury Park, CA: Sage.

[19] Garton, L., Haythornthwaite, C., & Wellman, B. (1999). Studying on-line social networks. In S.G. Jones (ed.), Doing Internet Research: Critical Issues and Methods for Examining the Net, pp. 75-105. Thousand Oaks, CA: Sage.

[20] Geertz, C. (1973). The Interpretation of Cultures. New York: Basic Books.

[21] Goffman, E. (1959). The Presentation of Self in Everyday Life. Harmondsworth: Penguin Books.

[22] Goffman, E. (1961). Asylums. Chicago: Aldine.

[23] Granovetter, M. (1973). The strength of weak ties. American Journal of Sociology, vol. 78, pp. 1360-1380.

[24] Granovetter, M. (1974). Getting a Job. Cambridge, MA: Harvard University Press.

[25] Hammersley, M., & Atkinson, P. (1995). Ethnography, Principles in Practice, 2nd edition. London: Routledge.

[26] Harper, R. (2000). The organization in ethnography: A discussion of ethnographic fieldwork programs in CSCW. Computer Supported Collaborative Work, vol. 9, pp. 239-264.

[27] Haythornthwaite, C. (2000). Online personal networks: Size, composition and media use among distance learners. New Media and Society, vol. 2, no. 2, pp. 195-226.

[28] Haythornthwaite, C. (2001). The strength and the impact of new media. In the Proceedings of the IEEE Hawaii International Conference On System Sciences, January 3-6, 2001, Maui, Hawaii.

[29] Hine, C. (2000). Virtual Ethnography. London: Sage.

[30] Jones, S. (1999). Doing Internet Research: Critical Issues and Methods for Examining the Net. Thousand Oaks, CA: Sage.

[31] Jordan, T. (1999). Cyberpower: The Culture and Politics of Cyberspace and the Internet. London: Routledge.

[32] Kay, S.M. (1988). Modern Spectral Estimation: Theory and Applications. New Jersey: Prentice Hall.

[33] Kugiumtzis, D., & Boudourides, M.A. (1998). Chaotic analysis of Internet ping data: Just a random number generator? SOEIS project conference, Bielefeld, Germany, March 27-28, 1998. Electronic document: http://www.math.upatras.gr/~mboudour/articles/ping.ps.

[34] Latour, B. (1987). Science in Action. Cambridge, MA: Harvard University Press.

[35] Markham, A.N. (1998). Life Online: Researching Real Experience in Virtual Space. Walnut Creek, CA: AltaMira Press.

[36] Marsden, P., & Campbell, K.E. (1984). Measuring tie strength. Social Forces, vol. 63, pp. 482-501.

[37] McLaughlin, M.L., Osborne, K.K., & Smith, C.B. (1995). Standards of conduct on Usenet. . In S.G. Jones (ed.), CyberSociety: Computer-Mediated Communication and Community, pp. 90-111. Thousand Oaks, CA: Sage.

[38] Miles, M.B., & Huberman, A.M. (1994). Qualitative Data Analysis, second edition. Thousand Oaks, CA: Sage.

[39] Mische, A., & White, H. (1998). Between conversation and situation: Public switching dynamics across network domains. Social Research, vol. 65, no. 3, pp. 695-724.

[40] Mol, A., & Law, J. (1994). Regions, networks and fluids: Anaemia and social topology. Social Studies of Science, vol. 24, pp. 641-671.

[41] Paccagnella, L. (1997). Getting the seat of your pants dirty: Strategies for ethnographic research on virtual communities. Journal of Computer-Mediated Communication, 3(1). http://www.ascusc.org/ jcmc/vol3/issue1/paccagnella.html.

[42] Priestley, M.B. (1988). Non-linear and Non-stationary Time Series Analysis. New York: Academic Press.

[43] Rodino, M. (1997). Breaking out of binaries: Reconceptualizing gender and its relationship to language in computer-mediated communication. Journal of Computer-Mediated Communication, 3(3). http:// www.ascusc.org/jcmc/vol3/issue3/rodino.html.

[44] Silverman, D. (1993). Interpreting Qualitative Data: Methods for Analysing Talk, Text & Interaction. London: Sage.

[45] Skolnick, J. (1996). Justice Without Trial: Law Enforcement in a Democratic Society. New York: Wiley.

[46] Tepper, M. (1997). Usenet communities and the cultural politics of information. In D. Porter (ed.), Internet Culture, pp. 39-54. New York: Routledge.

[47] Titscher, S., Meyer, M., Wodak, R., & Vetter, R. (2000). Methods of Text and Discourse Analysis, translated by B. Jenner. London: Sage.

[48] Tsonis, A.A. (1992). Chaos: From Theory to Applications. New York: Plenum Press.

[49] Urry, J. (2000). Sociology Beyond Societies: Mobilities for the Twenty-first Century. London: Routledge.

[50] Wasserman, S., & Faust, K. (1994). Social Network Analysis: Methods and Applications. Cambridge, UK: Cambridge University Press.

[51] Weber, M. (1949). The Methodology of the Social Sciences. Edited by E.A. Shils & H.A. Finch. Glencoe, IL: The Free Press.

[52] Wellman, B. (1988). Structural analysis: From method and metaphor to theory and substance. In B. Wellman & S.D. Berkowitz (eds.), Social Structures: A Network Approach, pp. 19-61. Cambridge, UK: Cambridge University Press.

[53] Wellman, B., Salaff, J., Dimitrova, D., Garton, L., Gulia, M., & Haythornthwaite, C. (1996). Computer networks as social networks: Collaborative work, telework, and virtual community. Annual Review of Sociology, vol. 22, pp. 213-238.

[54] White, H.C. (1992). Identity and Control: A Structural Theory of Social Action. Princeton, NJ: Princeton University Press.

[55] Wilson, W.J. (1997). When Work Disappears: The World of the New Urban Poor. New York: Alfred A. Knopf.


Buchanan, Tom ; Reips, Ulf-Dietrich Institution: Department of Psychology, University of Westminster, London
Article (version: 25/06/2002 - 07:47, size: 22686)
"Platform-dependent biases in Online Research: Do Mac users really think different?"
German:

1. Introduction

In the first few years of online research, there have been rapid advances in a number of areas. Some of this research has been devoted to an exploration of the critical question of whether the Internet is an appropriate medium for psychological research. Such explorations of validity issues have on the whole been encouraging: Krantz & Dalal (2000), for instance, provide a review of studies which permit comparison of online and offline work, and suggest that by and large we can do valid research online.

Other types of studies have looked at online research methodology: what are the strengths and weaknesses of different techniques, what are the advantages and potential problems we may encounter? Dillman, Tortora, Conradt and Bowker (1998), for example, have shown that it is best to keep online questionnaires as simple as possible to reduce dropout rate. Musch, Broeder and Klauer (2001) have shown that the "randomised response technique" can be used to control for the possibility that people might give misleading answers to sensitive questions. Reips (2000) lists some of the strengths and weaknesses of online research, and suggests techniques for overcoming some of the problems.

Studies are also being published which move beyond methodological issues, and focus on important psychological phenomena. For these, the online environment may simply be the medium and not the focus of research (though there will indubitably be many for which it is both). An example is a study by Rogers et al (in press) looking at links between drug use and self-reported memory problems. This has supported laboratory findings with data from the much larger samples obtainable via the Internet.

As well as advances in psychological aspects of online research, there have been technological advances. As hardware and software develop, the range of techniques and tools we can use grows, and there is increasing sophistication in web research techniques.

While most web experiments used to be conducted using basic HTML and CGI combinations (and many still are) there are now many other techniques which have been adopted by online researchers. These often allow better visual presentation and more interactivity, achieving more control over the experimental environment through technologies such as Javascript, Java applets, and systems such as the Macromedia Authorware Web Player (formerly called Shockwave). All of these have been used in online research projects.

Many web researchers have already capitalised on the technological opportunities available to us. This is clearly a sign of progress, as the field develops. However, it may also bring problems.

The key question is whether or not all potential participants will have the software configurations required to participate in the study. In most cases, they probably will – but if an experiment requires the user’s browser to interpret anything other than plain HTML, there is a risk that some people will not be able to participate or will have a different experience of the experiment in terms of stimulus presentation (e.g. Burt et al, 2001).

Research using advanced techniques makes the assumption that everyone has the appropriate software available, or that if not then they are willing and able to install it (e.g. download plugins and players). There are ways of doing this relatively easily: for instance, studies employing Javascript based routines can screen people out or request that they use Javascript-enabled browsers. However, there are some (admittedly few) browsers which cannot handle Javascript, and there are some web users who prefer to disable Javascript in their browsers. This might be done for security reasons, to speed up their browsing, or to prevent annoying page redirections and popup windows. Might it be the case that people who use Javascript enabled browsers differ psychologically in some way (perhaps less security conscious, or less reluctant to hand control of their browser to a website) from those who do not?

As another example, some studies make use of video or audio players (e.g. the Authorware web player). These will advise potential participants that they need to install the relevant player. Again, this is easily done – the software can usually be downloaded freely.

However, some people may be unwilling to do this. Download times are frequently long (for example, at the time of writing the Authorware Web Player takes 11 minutes to download on a 56K modem – assuming optimal conditions). Depending on participants’ patience, the cost to them of being online for so long, level of confidence in their ability to install the player, and fear of introducing a virus or otherwise harming their system, some people may well choose not to download and install such players.

As well as those who are unwilling, there may be others who are unable to download and install players. This may be due to factors such as their connection speed, the power of the machine they are using, corporate or institutional policies (many participants in online studies are students sitting in computer labs – and educational institutions frequently forbid installation of software on classroom machines), and availability for their platform. At the time of writing, for instance, the Authorware Web Player was not available for all platforms. There was no EPOC version, and versions available for some other platforms (e.g. Linux and some Macs) were only compatible with Netscape and not other browsers – so one might have to install a different browser to participate in a study, not just the plugin!

Therefore, the possibility arises that by using advanced techniques one is preventing some potential participants from taking part in one’s study. Given the huge numbers of participants potentially available, though, does it matter if a few are screened out? It might.

Whether or not there is a problem will probably depend on the reasons for exclusion, especially if these are psychological in nature. If those who participate are psychologically different from those who might wish to but cannot, biases may be introduced which could affect experimental outcomes.

A related issue is the possibility that there might be psychological differences between different groups of computer users. If an experiment relies on software which will not run on a particular computer platform or operating system (as in the case of the web player described above), and if users of that system (who are thus excluded from participation) are in some way psychologically different from users of other systems, bias may again be introduced.

At least one computer company has made a lot of money from the suggestion that their users of their machines are different: Apple’s highly successful “Think Different” marketing campaign introduced the idea that Macintosh users were somehow different and more creative, by using advertising images of artists, athletes, scientists and various exceptional people. As well as such marketing ploys, there have been suggestions in the literature (e.g. Turkle, 1995) that Macintosh and PC users did differ in the way they thought and preferred to interact with their machines. Such suggestions are mainly anecdotal in nature, but the suggestion that PC and Macintosh users might differ in personality is worthy of exploration.

The goals of this project were, accordingly, to investigate (1) whether users of different computing platforms differed in personality, and (2) whether people using Javascript-enabled browsers differed from those unable or unwilling to use Javascript.

2. Method

The instrument used to assess personality was an existing online Five Factor personality inventory (Buchanan, Goldberg & Johnson, 1999) which provides indices of the five domains of the Five Factor Model (as described by Costa and McCrae, 1992) - Openness, Conscientiousness, Extraversion, Agreeableness and Neuroticism. The inventory has 42 items and is based on an IPIP inventory developed by Goldberg (1999). The five scales are acceptable in terms of internal consistency, and there is some preliminary evidence (based on correlations with self-reports of relevant behaviour) of validity.

For the purposes of the current study, a few additional questions were added to the end of the existing questionnaire. These included demographic information, and a question about the type of computer the respondent was using (PC, Mac, Other, Don’t Know). Participants were also asked whether their data could be used in analysis (so that people who did not consent, or who had not answered the questions seriously, could indicate that this was the case).

Participants found the inventory either via search engines or through links from other sites. Having completed the inventory, they receive instant feedback on their scores. Recruiting for this study was thus completely passive: no attempts were made to solicit volunteers; these were people who were actively looking for a personality test to complete. During the period of this study, an average of ten to fifteen people were completing the inventory every day.

The study was set up so that Javascript users and non-users were automatically assigned to different conditions. On arrival at the first page, a Javascript routine immediately redirected participants to an informed consent page. Those participants who did not have Javascript enabled obviously were not redirected. They instead saw a message saying the page had moved and asking them to click on a provided link. That link took them to another informed consent page. People entering through each of these two routes had an identical experience from that point on: the only difference between the two conditions was the datafile in which their responses were eventually logged. Having indicated their consent, participants were presented with the inventory and additional questions. On submitting their data, they were presented with an automatically generated description of their scores and a debriefing page.


3. Results

Prior to analysis, the dataset was screened for possible multiple submissions or data unusable for other reasons. 526 submissions were excluded because they came from IP addresses from which a response had previously been recorded, and might thus be duplicate submissions from the same person. 253 submissions were excluded because the responded had indicated that their data should not be used for analysis. Finally, 4 submissions were excluded because of implausible patterns of demographic responses (e.g. education levels which did not match their responses. Following this screening, 2148 apparently valid responses from unique IP addresses remained.

These comprised 865 men (40.3% of sample) and 1283 women (59.7% of sample). The most commonly reported location was the USA (51.8%), followed by Europe (31.0%). The largest proportion (46.9%) was employed for wages. There was also a considerable number who were students (41%). In terms of the main variables of interest, the majority of participants were PC users using Javascript enabled browsers. 1626 reported using PCs, 114 indicated that they were using a Mac, 211 were using another (unspecified) platform and 197 reported that they did not know what type of computer they were using. 1996 were using Javascript enabled browsers and 152 were not.

Javascript users and non-users did not differ significantly on any of the five personality dimensions assessed. They did however differ in level of education: a Mann-Whitney test indicated that Javascript users were significantly less educated (U=133321.5, p<.021). The modal level of education for those using Javascript enabled browsers was “Some college/university”. The modal level of education for those whose browsers were not Javascript enabled was “College/University graduate”.

When users of different computing platforms were compared, it was found that people who reported using Macs and PCs differed on one personality dimension: Openness (t(1738) = 4.60, p < .0005). Mac users were significantly higher in Openness (Mean = 28.04, SD = 4.93) than PC users (Mean = 25.84, SD = 4.94). There were no other significant differences between users of different computers.

4. Discussion

The results of this study appear to indicate people who used Javascript differed in education level from those who did not, and that Macintosh and PC users differed in levels of Openness. How are these differences to be explained?

A possible explanation for the Javascript results makes the assumption that people deliberately turned off Javascript functionality in their browsers (whether for security reasons, or to speed up browsing). In order to turn off this functionality, one needs to know what Javascript is, and why one might wish to disable it. Then, assuming one knows that it can be turned off, one needs to know how to actually do so at a mechanical level – an option that is well hidden in some modern browsers. It seems reasonable that possession of this knowledge will be a function of length of experience with using the Internet, which in turn is likely to correlate with education: the more time one has spent in education, the more likely one is to have used computers at an “expert” level for a longer period of time.

The difference between PC and Macintosh users is somewhat more interesting. People who score low on the dimension of Openness can be characterised as “down to earth”. They may be conventional and conservative in behaviour and outlook, less interested in art and culture, more practical in nature. High scorers, on the other hand, are likely to be more imaginative, more creative, more likely to seek out cultural and educational experiences. The fact that Macintosh users tended to score higher is consistent with both popular stereotypes and Apple’s marketing campaign – people low in Openness might be reasonably be expected to be less likely to “Think Different”. Might they thus be less likely to choose a Macintosh computer?

Another possibility is that some characteristics of the hardware and software being used influenced the way in which people responded. Despite some degree of convergence, the “look and feel” of PCs and Macs are still different (compare, for instance, the appearance of a colourful, futuristic looking iMac with a conventional desktop PC).

A third possibility is that the difference is an artefact. Macintosh computers are frequently used in creative, artistic settings: they are, for instance, well suited to art and design applications, manipulation of graphics, editing music and video. Therefore, people working in such settings—whom one might expect to be high in Openness—might be likely to end up using Macs rather than PCs, simply because those are the machines used in their workplace (or study environment). It could therefore be that more Open people simply happened to participate using Macs, not PCs, because those were the machines sitting on their desks.

It is clear that further work is required to uncover the reasons for the PC-Mac difference. However, whatever the ultimate explanation for the differences observed, the fact that there were differences at all has implications for online research.

It seems clear that if the current study had been accessible only to people with Javascript enabled browsers, or required software which would run only on a PC and not a Macintosh, a number of potential participants would have been excluded. Furthermore, there is evidence that the people who would have been excluded differed significantly from the rest of the sample in ways that could conceivably affect experimental outcomes. The possibility of technologically-caused biases seems to be a very real one.

In some circumstances, biases may not cause problems. For instance, Schwarz and Reips (1999) found no difference in results obtained with parallel CGI and Javascript versions of a study on the hindsight bias (despite a 13% higher dropout rate in the CGI condition). In other circumstances, they might be very problematic. Any work which seeks to obtain samples representative of some larger population will need to ensure that sections of that larger population are not exclude for technical reasons. Any work which relies on reference to norms (if that is in fact a meaningful concept in any non-finite Internet population) must take account of the fact that different norms might be needed for participants with different hardware and software setups.

The studies most likely to be at risk of problems are those where the phenomenon under investigation is linked to the construct with respect to which there is bias. For example, there are indications that Openness correlates with use of illicit drugs--people high in Openness are more likely to take substance-related risks (Furnham & Heaven, 1999). If a study like that of Rogers et al (in press) which seeks to recruit from drug-using populations excludes people high in Openness, a substantial proportion of the population of interest may be excluded. Similarly, Openness has been found to correlate with concern for social welfare (Furnham & Heaven, 1999). Some online studies have asked about issues such as donations to charity. Had they excluded people particularly high or low on Openness, could the results have been affected?

There are “real world” implications as well, especially with the growing use of online psychometric tests for personnel recruitment and selection. Imagine the scenario where an online recruitment agency wished to select applicants for a post in a creative industry where Openness was an important predictor of job performance—yet did this using a website which could not be properly viewed on a Macintosh. The most suitable candidates might thus be excluded from the selection process.

One might query whether there is actually a real problem here. With respect to the comparisons made in this study, almost all browsers nowadays are Javascript enabled, and almost all web content is accessible on both PC and Macintosh platforms. While the effect size (especially for the PC / Macintosh user comparison) is medium – of the order where it could importantly influence experimental results – relatively small numbers of people are affected by it. However, the fact that differences were found even for these comparisons suggests that in cases where potential participants are required to download and install players or other software, there may be bigger and more important differences. This is a question which can only be resolved, however, by further research.

It should also be noted that situations are likely to change over time, depending on the penetration of the technology used. At the time of writing, most web users will be using browsers capable of handling Javascript. Two years ago that might not have been the case. Obviously, the more people adopt a new technology the smaller the problem becomes. Other factors may also influence people’s willingness to download and install software – after a heavily publicised virus outbreak, for instance, they may be more cautious.

This study appears to have demonstrated that users of different hardware and software configurations can differ psychologically. It follows from this that if certain groups of users are excluded from participating in a study, the samples obtained in that study may be biased. Under some circumstances, this might affect core findings. We know of situations (parallel Javascript and CGI conditions) where findings have not been affected, but can envision situations where they might. On the basis of these observations, it seems prudent to recommend that online researchers should use the most basic and platform-independent technologies with which their research objectives can be achieved. There may well be times when the cutting edge of Internet technology is not the best tool for the job.

5. References

Buchanan, T., Goldberg, L.R., & Johnson, J.A. (1999, November). WWW personality assessment: Evaluation of an online Five Factor Inventory. Paper presented at the meeting of the Society for Computers in Psychology, Los Angeles, CA.

Burt, M., Little, A., Tiddeman, B., Penton-Volk, I., & Perrett, D. (2001). Experimenting with the web: Illustrative studies investigating facial attractiveness. Proceedings of The British Psychological Society, 9, 165.

Costa, P. T., Jr., & McCrae, R. R. (1992). Revised NEO Personality Inventory (NEO-PI-R) and NEO Five-Factor Inventory (NEO-FFI): Professional Manual. Odessa, FL: Psychological Assessment Resources.

Dillman, D. A., Tortora, R. D., Conradt., J., & Bowker, D. (1998, August). Influence of Plain vs. Fancy design on response rates for web surveys. Paper presented at Joint Statistical Meetings, Dallas, Texas.

Furnham, A., & Heaven, P. (1999). Personality and Social Behaviour. London: Arnold.

Goldberg, L. R. (1999). The Development of Five-Factor Domain Scales from the IPIP Item Pool. [On-line]. Available URL: http://ipip.ori.org/ipip/memo.htm

Krantz, J. H., & Dalal, R. (2000). Validity of Web-based psychological research. In M. H. Birnbaum (Ed.), Psychological Experiments on the Internet (35-60). San Diego: Academic Press.

Musch, J., Broeder, A., & Klauer, Ch. (2001). Improving survey research on the World-Wide Web using the Randomized Response Technique. In U.-D. Reips & M. Bosnjak (Eds.). Dimensions of Internet Science, (179-192). Lengerich: Pabst Science Publishers.

Reips, U.-D. (2000). The Web experiment method: Advantages, disadvantages, and solutions. In M. H. Birnbaum (Ed.), Psychological Experiments on the Internet, (69-117). San Diego: Academic Press.

Rodgers, J, Buchanan, T, Scholey, A.B., Heffernan, T.M., Ling, J., & Parrott. A. (In Press). Differential effects of ecstasy and cannabis on self-reports of memory ability: a web-based study. Human Psychopharmacology (special edition: The neuropsychopharmacology of MDMA).

Schwarz, S., & Reips, U.-D. (2001). CGI versus Javascript: A Web experiment on the Reversed Hindsight Bias. In U.-D. Reips & M. Bosnjak (Eds.). Dimensions of Internet Science, (75-90). Lengerich: Pabst Science Publishers.

Turkle, S. (1995). Life on the Screen: Identity in the age of the Internet. New York: Simon & Schuster.


Bunz, Ulla K. ; Institution: Communication Studies, University of Kansas
Article (version: 25/06/2002 - 07:47, size: 29685)
"The Computer-Email-Web Fluency Scale - Development and Results"
German:

Please note that this is a very abbreviated version of the paper presented. A full copy of the paper (approx. 48 pages double spaced incl. references and statistical tables) can be obtained from Ulla Bunz ulla@ukans.edu.

RATIONALE

It's clear that the conceptualization and measurement of any set of skills is extremely difficult. It should not be surprising therefore that scholars, researchers and practitioners interested in assessing computing/technological understanding and skills have been challenged to develop measurement tools that adequately capture and assess components of these skill sets. Recently a national level board of scientists and practitioners in the United States was formed to make some sense of this developing area. In their response to this challenge, the Committee on Information Technology Literacy (CITL) of the National Research Board issued a report, Being fluent with information technology. In this monograph, the Committee focused on "fluency" and distinguished it from other commonly used terms including literacy and competency. According to the report, fluency is "a term connoting a higher level of competency" (Committee on Information Technology 1999, p. 2). Some of the differences between fluency and competency are first, that fluency entails a lifelong learning process; second, that fluency implies personalization of skills on levels of sophistication; and third, that fluency is composed of three kinds of knowledge, contemporary skills, foundational concepts, and intellectual capabilities.

Previous research developed measuring instruments for computer literacy, computer experience, computer expertise, computer knowledge etc. However, our social and technological environment is constantly changing as information technology (IT) becomes ubiquitous, and apart from specific computer skills required by some experts (programming, operating system knowledge, hardware expertise, etc.), most people's daily environment (in developed countries) now demands a rather broad, far ranging IT skill set that has not been necessary in the past. Foremost among these fluencies are "information seeking" and "information dissemination" skills including email use and the ability to effectively utilize the World Wide Web. It is critical that we develop measures that adequately tap this increasingly important set of competencies.

Thus, the purpose of this study was to develop an instrument to assess people’s ability to use these information seeking and dissemination skills, including skills that involve computer use, email and effective use of the web. This instrument was not designed to be another "computer literacy," experience, expertise or knowledge scale. Instead we took our cues from the recent CITL monograph, and attempted to assess more general "fluency" skills. In addition, though computer fluency, email fluency and web fluency can be expected to be related, this study presumed that email and web fluency were not necessarily subsumed by "computer fluency." Specifically then, the purpose of this study was to develop what we hope is a more general and useful measure, the Computer-Email-Web Fluency (CEW Fluency) scale.

LITERATURE

Over the last few years a considerable body of literature has developed to describe computer usage and attitudes toward computers, computer anxiety, computer stress, perceptions of computers (i.e., Bear, Richards & Lancaster 1987; Coovert & Goldstein 1980; Crable , Brodzinski & Scherer 1991; Durndell, Macleod & Siann 1987; Edwards 1957; Gardner, Discenza & Dukes 1993; Harrison & Rainer 1992; Heinssen, Glass & Knight 1987; Hudiburg, Brown & Jones 1993; Igbaria & Chakrabarti 1990; Kay 1993b; Loyd & Gressard 1984; Maurer 1994; Nickell & Pinto 1986; Pope-Davis & Twing 1991; Woodrow 1991; etc.). This broad array of research is multi-disciplinary and incorporates a wide variety of perspectives and topics. However, at its foundation this research is directed at influencing a person’s ability to use a computer efficiently.

This study was less interested in people’s reservations towards technology, and more in their own perceptions of their ability of fluency in using the computer for email communication, and information access. Hence, this review focuses more on scales that measure computer expertise, experience, or literacy.

Educators have been aware of the need to develop a concept of computer literacy for a long time (Molnar 1978; Watt 1980). In the computer and technology context, literacy has been defined and described repeatedly. According to Rhodes (1986), an individual is computer literate when he or she is able to use the computer to satisfy personal needs. After reviewing the literature (i.e. ISACS 1985; Johnson et al. 1980; Levin 1983; Longstreet & Sorant 1985), LaLomia and Sidowski (1990) conclude that the definition of computer literacy varies depending on the study, but usually includes one or more of the following factors: programming and operating skills, knowledge and awareness of computers, and positive attitude toward computers. Watt (1980, p. 3), as quoted in Levine and Donitsa-Schmidt (1997) defines computer literacy as the "collection of skills, knowledge, understanding, values, and relationships that allow a person to function comfortably as a productive citizen in a computer-oriented society." With this definition, Watt comes close to the definition of information fluency (Committee on Information Technology Literacy 1999) discussed earlier.

Along with numerous definitions, conceptual and theoretical discussions (i.e., Baxter 1984; Cheng, Plake & Stevens 1985; Ganske & Hamamoto 1984; Kay 1990; Levinson 1986), there is a growing body of literature to assess computer experience, expertise or literacy statistically (i.e., Anderson et al 1979; Bitter & Davis 1985; Born & Cummings 1994; Gabriel 1985a & b; Montag 1984).

Good overview-reviews can be found in LaLomia and Sidowski (1990), Miller, Stanney, and Wooten (1997), Moroz and Nash (1997), and most of the articles reviewed in detail in the long version of this paper, especially Panero, Lane and Napier (1997), Potosky and Bobko (1998), or Smith et al. (1999).

SCALE DEVELOPMENT & CONCLUSIONS

The Computer-Email-Web Fluency scale was developed in several steps that are summarized here. First, a focus group/Q-methodology (McKeown & Thomas 1988) pilot study was conducted. A total of thirty-two subjects in seven groups of three to six people were asked to sort possible questions for the measure. Confusing questions were reworded and several new questions were added to create a 52-item instrument.

In the following two pilot studies, the instrument was administered to a total of 284 subjects. The 52 items were divided into three subscales: 19 items for computer skills; 18 items for email skills; 15 items for Internet skills. All items began with the words "I can …" followed by the task, followed by the answer options, a 4-point Likert scale (Very well, well, not so well, not at all). Basic frequencies, including means, standard errors, modes, and standard deviations were assessed for all items. Coefficient alphas were determined for the items of each subscale and for the overall scale, consisting of 52 items.

A principal-component factor analysis followed by a varimax rotation was used to determine the factor validity. Finally, a correlation matrix was used for all remaining 21 items, and between the four resulting factors to demonstrate internal validity of the CEW Fluency scale.

Internal reliability for the subscales ranged from .92 to .93, with the total scale showing a total reliability of .96. Through factor analysis, the 52-item instrument was reduced to a 21-item instrument. After this factor analysis, the internal reliabilities of the subscales still ranged from .82 to .89. Overall, the purpose of Pilot Two & Three was to identify statistically clean subscales of the CEW Fluency Scale. Originally, items were divided into three subscales, computer skills, email skills, and web skills.

The principal-components factor analysis rotated into four factors, separating Internet skills into two subscales, web navigation skills and web editing skills. While not predicted, these results are reasonable. In accordance with results from Pilot One it can be assumed that a person may have (basic) web navigation skills without (intermediate) web editing skills.

Alpha coefficients of all four subscales showed high internal subscale reliability. In addition, results from the principal-components factor analysis and correlations showed strong internal validity for the total scale. Results showed that the subscales were related to each other at a medium level, yet warrant differentiation from each other and the skills they measure. This also implies that using email and World Wide Web use are viewed separately from "computer skills." These skills are related but separate and thus, this new scale is not simply a new computer experience, expertise, or literacy scale.

Finally, a fourth pilot study was conducted. The CEW Fluency scale, the Computer Use Scale (Panero, Lane & Napier 1997), and items from the Georgia Tech WWW User Survey (Georgia Tech 1998) were included for a total of 77 items.

Basic frequencies, including means, standard errors, modes, and standard deviations were assessed for all items. Coefficient alphas were determined for the items of each subscale and total scale of the CEW Fluency and the CUS scales. A correlation matrix was used to assess how each item or each subscale related to the subscales of the CEW Fluency scale, and to the total scale. Correlations between individual items of the CEW Fluency scale and other items will be discussed were appropriate. One-way analysis of variance (ANOVA) and Tukey Post Hoc tests were used to detect differences between the subscales and the total CEW Fluency scale, and several other questions. Finally, regression analysis was employed to investigate the interrelationship of the highly correlated variables.

The purpose of this study was to continue the validation process of a new measure of computer, email, and web fluency (CEW Fluency). The sample consisted of 143 student volunteers enrolled at a large U. S. midwestern university.

Based on the Georgia Tech (1998) survey instructions, subjects in this study were ranked into experience categories depending on the number of Internet and World Wide Web related tasks they had performed. According to this ranking most subjects were classified as novices or as having intermediate World Wide Web skills. Subjects report using the Internet for no longer than six years and have taken two or fewer classes on either computer or Internet related topics. A large majority of subjects in this sample access the Internet from home on a daily basis, and from school at least on a weekly basis, but mostly the time spent online is comparatively short. As can be expected in a sample drawn from a student population, most subjects use the web for educational or information gathering purposes. Specifically, subjects indicated they use the web mostly for online chat or discussion, or for ordering products.

Subjects reported their self-assessed computer-email-web fluency to be very high, especially regarding computer, email, and web navigation fluency. Web editing fluency was reported at a slightly lower level, mostly due to a wide variation regarding subjects’ ability to create a website. Reliabilities of the subscales and the total scales were lower than during the previous study, but still within acceptable range (between .64 and .79). Correlations between the subscales were higher than in the previous studies. The scale needs more testing before its stability can be ascertained.

The computer use scale (Panero, Lane & Napier 1997) used in this study also resulted in slightly lower reliabilities than reported by the authors. This could possibly be due to the homogeneity of the student sample.

CEW Fluency scores were correlated to a number of demographic variables, including gender, major, or ability to access the Internet from home. However, a variety of interesting findings did emerge.

Overall, results indicated that the longer subjects had been using the Internet, the greater their overall CEW Fluency. Results indicated that subjects had to be classified at least at an "intermediate" level of web expertise to have higher CEW Fluency. Results also indicated that there was no statistical difference between "experience" and "expertise" with regard to web editing fluency. Overall, the more comfortable subjects felt with computers or the Internet, the higher their reported CEW Fluency. One exception to this overall trend was that only subjects who felt very comfortable with the computer reported high web editing fluency. Also, only subjects who felt very comfortable with the Internet reported high computer fluency. No systematic trend was found for the relationship between Internet comfort level and subjects’ web navigation fluency. Subjects reported that they must feel at least somewhat satisfied with their current Internet skills in order to report high CEW Fluency. Equally, subjects who used computers frequently on the Computer Use Scale (Panero, Lane & Napier 1997) reported higher CEW Fluency.

Regression analysis revealed that, despite being highly correlated, subjects’ perceived level of comfort using a computer, the length of time they have been using the Internet, and subjects’ computer use according to the Computer Use Scale all made independent contributions to the variance explained in CEW Fluency.

Since the measures utilized in the investigation used self-report, results might not be surprising. Subjects who feel like they have more experience and a higher comfort level tend to self-report higher CEW Fluency. Clearly further investigations are needed to compare self-reported CEW Fluency to actual ability to perform CEW tasks in a laboratory situation. In addition, further studies may be needed to expand the CEW Fluency scale to include more sophisticated items. It might also be necessary to develop and test this expanded version of the scale with subjects other than university students. At this point this study provides preliminary support for the CEW Fluency.

In summary then, the purpose of this project was to develop a new scale based on existing literature and computer literacy and expertise scales. The Computer-Email-Web Fluency scale differs from the existing scales because it incorporates email and web items. Support was found that email and web skills are to be differentiated from computer skills. Thus, the CEW Fluency scale can be differentiated from existing scales. More research is clearly needed both to establish and to test the utility of this instrument.

REFERENCES

Anderson, R. E., Hansen, T. P., Johnson, D. C., & Klassen, D. L. (1979). Minnesota Computer Literacy Awareness Assessment (Technical Report). St. Paul, MN: Minnesota Educational Computing Consortium.

Badagliacco, J. M. (1990). Gender and race differences in computing attitudes and experience. Social Science Computer Review, 8, 42-64.

Ballance, C. T., & Balance, V. V. (1993). Relating self-rated computer experience to computer stress. Psychological Reports, 72 (2), 680-682.

Baxter, H. J. (1984, February). Computer literacy: Is it worth the effort? Personal Software, 37-41.

Bear, G. G., Richards, H. C., & Lancaster, P. (1987). Attitudes towards computers: Validation of a computer attitudes scale. Journal of Computing Research, 32 (2), 207-219.

Bitter, G. G., & Davis, S. J. (1985). Measuring development of computer literacy among teachers. AEDS Journal, 18 (4), 243-253.

Born, R. G., & Cummings, C. W. (1994). An assessment model for computer experience, skills, and attitudes of undergraduate business students. Journal of Computer Information Systems, 35 (1), 41-53.

Campbell, D. T., & Fiske, D. W. (1959). Convergent and discriminant validation by the multitrait-multimethod matrix. Psychological Bulletin, 56 (2), 81-105.

Cassel, R. N., & Cassel, S. L. (1984). Cassel computer literacy test (CMLRTC). Journal of Instructional Psychology, 11, 3-9.

Cheng, T. T., Plake, B., & Stevens, D. J. (1985). A validation study of the computer literacy examination: Cognitive aspect. AEDS Journal, 18, 139-152.

Cockrell, K., Cockrell, D., & Harris, E. L. (1998). Generational variability in the understanding and use of technology. Alberta Journal of Educational Research, 44 (1), 111-114.

Committee on Information Technology Literacy (1999). Being fluent with information technology. Washington, D. C.: National Academy Press.

Compeau, D., Higgins, C. A., & Huff, S. (1999). Social cognitive theory and individual reactions to computing technology – A longitudinal study. MIS Quarterly, 23 (2), 145-158.

Coovert, M. D., & Goldstein, M. (1980). Locus of control as a predictor of users’ attitudes toward computers. Psychological Reports, 47, 1167-1173.

Crable, E. A., Brodzinski, J. D., & Scherer, R. F. (1991). Psychology of computer use: XXII. Preliminary development of a measure of concerns about computers. Psychological Reports, 69, 235-236.

Davis, F. D., Bagozzi, R. P., & Warshaw, P. R. (1989). User acceptance of computer technology: a comparison of two theoretical models. Management Science, 35, 982-1003.

Durndell, A., Macleod, H., & Siann, G. (1987). A survey of attitudes to knowledge about and experience of computers. Computer Education, 11 (3), 167-175.

Edwards, A. L. (1957). Techniques of attitude scale construction. New York: Appleton-Century-Crofts.

Egan, D. E. (1988). Individual differences in human-computer interaction. In M. Helanander (Ed.), Handbook of human-computer interaction, pp. 543-568. Amsterdam: North-Holland.

Ellsworth, R., & Bowman, B. E. (1982). A "beliefs about computers" scale based on Ahl’s questionnaire items. The Computing Teacher, 10 (4), 32-34.

Fishbein, M., & Azjen, I. (1975). Belief, attitude, intention and behavior: an introduction to theory and research. Massachusetts: Addison-Wesley.

Gabriel, R. M. (1985a). Assessing computer literacy: A validated instrument and empirical results. AEDS Journal, 18 (3), 153-171.

Gabriel, R. M. (1985b). Computer literacy assessment and validation: Empirical relationships at both student and school levels. Journal of Educational Computing Research, 1 (4), 415-425.

Ganske, L., & Hamamoto, P. (1984). Response to crisis: A developer’s look at the importance of needs assessment to teacher educators in the design of computer literacy training programs. Educational Computer Technology Journal, 32 (2), 101-113.

Gardner, D. G., Discenza, R., & Dukes, R. L. (1993). The measurement of computer attitudes: An empirical comparison of available scales. Journal of Educational Computing Research, 9, 487-507.

Geissler, J. E., & Horridge, P. (1993). University students’ computer knowledge and commitment to learning. Journal of Research on Computing in Education, 25, 347-365.

Georgia Tech (1998). WWW user survey. Available online at http://www.cc.gatech.edu/gvu/user_surveys/

Harrison, A. W., & Rainer, R. K. (1992). An examination of the factor structures and concurrent validities for the Computer Attitude Scale, the Computer Anxiety Rating Scale, and the Computer Self-Efficacy Scale. Educational and Psychological Measurement, 52, 735-745.

Heinssen, R. K., Glass, C. R., & Knight, L. A. (1987). Assessing computer anxiety: development and validation of the computer anxiety rating scale. Computers in Human Behavior, 3, 49-59.

Hudiburg, R. A., Brown, S., & Jones, T. M. (1993). Psychology of computer use: XXXIX. Measuring computer users’ stress: the computer hassles scale. Psychological Reports, 73, 923-929.

Igbaria, M., & Chakrabarti, A. (1990). Computer anxiety and attitudes towards microcomputer use. Behaviour and Information Technology, 9 (3), 229-241.

ISACS (1985, November). Mission: define computer literacy. The Computing Teacher, 10-15.

Jay, G. M. & Willis, S. L. (1992). Influence of direct computer experience on older adults’ attitudes toward computers. Journal of Gerontology, 47 (4), 250-257.

Jiang, J. J., Motwani, J., Cheung, W. M., & Cheng, C. H. (1999). Attitudes toward the Internet/WWW – A comparison of students in US, France, and Hong-Kong. Journal of Computer Information Systems, 39 (3), 1-5.

Johnson, D. C., Anderson, R. E., Hansen, T. P., & Klassen, L. (1980, February). Computer literacy – What is it? Mathematics Teacher, 91-96.

Kay, D. S., & Black, J. B. (1990). Knowledge transformations during the acquisition of computer expertise. In S. P. Robertson, W. Zachary, & J. B. Black (Eds.), Cognition, computing, and cooperation, pp. 268-303. Norwood, NJ: Ablex.

Kay, R. (1990). The relation between computer literacy and locus of control. Journal of Research on Computing in Education, 22 (4), 464-474.

Kay, R. (1992). An analysis of methods used to examine gender differences in computer-related behavior. Journal of Educational Computing Research, 8 (3) 277-290.

Kay, R. (1993a). A practical research tool for assessing ability to use computers: The Computer ability survey (CAS). Journal of Research in Computing in Education, 26, 16-27.

Kay, R. (1993b). An explanation of and practical foundations for assessing attitudes toward computers: The Computer Attitude Measure (CAM). Computers in Human Behavior, 9, 371-386.

Kim, J., & Mueller, C. W. (1978). Factor analysis. Statistical methods and practical issues. Beverly Hills, CA: Sage.

Klassen, D. L., Anderson, R. E., Hansen, T. P., & Johnson, D. E. (1980). A study of computer literacy in science education: Final report. 1978-1980. St. Paul: Minnesota Educational computing consortium.

Krissoff, A., & Konrad, L. (1998). Computer training for staff and patrons: a comprehensive academic model. Computers in Libraries, 18 (1), 28-31.

LaLomia, M. J., & Sidowski, J. B. (1990). Measurements of computer satisfaction, literacy, and aptitudes: A review. International Journal of Human-Computer Interaction, 2, 231-253.

Lee, J. A. (1986). The effects of past computer experience on computerized aptitude test performance. Educational and Psychological Measurement, 46, 727-733.

Levin, D. (1983, March). Everyone wants "computer literacy" so maybe we should know what it means. The American School Board Journal, 25-28.

Levine, T., & Donitsa-Schmidt, S. (1998). Computer use, confidence, attitudes, and knowledge – A causal-analysis. Computers in Human Behavior, 14 (1), 125-146.

Levinson, E. M. (1986). A review of the computer aptitude, literacy, and interest profile (CALIP). Journal of Counseling and Development, 64, 658-659.

Longstreet, W. S., & Sorant, P. E. (1985). Computer literacy – Definition? Educational Horizons, 63 (3), 117-120.

Loyd, B. H., & Gressard, C. (1984). Reliability and factorial validity of computer attitude scales. Educational and Psychological measurement, 44, 501-505.

Maurer, M. M. (1983). Development and validation of a measure of computer anxiety. Unpublished Master’s Thesis. Iowa State University.

Maurer, M. M. (1994). Computer anxiety correlated and what they tell us: A literature review. Compuers in Human Behavior, 10, 369-376.

McKeown, B., & Thomas, D. (1988). Q methodology. Newbury Park, CA: Sage.

Miller, L. A., Stanney, K. M., & Wooten, W. (1997). Development and evaluation of the Windows-computer-experience-questionnaire (WCEQ). International Journal of Human-Computer Interaction, 9 (3), 201-212.

Molnar, A. R. (1978). The next great crisis in American education: computer literacy. AEDS Journal, 11 (1), 11-20.

Montag, M. (1984). Development and validation of a criterion-referenced computer literacy assessment instrument. Unpublished master’s thesis, Iowa State University, Ames, IA.

Montag, M., Simonson, M. R., & Maurer, M. M. (1984). Standardized Test of Computer Literacy (STCL). Amers: Iowa State University Research Foundation.

Moroz, P. A., & Nash, J. B. (1997). Assessing and improving the factorial structures of the computer self-efficacy scale. Paper presented at the Annual Meeting of the American Educational Research Association, Chicago, IL, March 24-28.

Murphy, C. A., Coover, D., & Owen, S. V. (1989). Development and validation of the Computer self-efficacy Scale. Educational and Psychological Measurement, 49, 893-899.

National Assessment of Educational Progress (1986). A framework for assessing computer competence: defining objectives. Available at ED 273683.

Nickell, G. S., & Pinto, J. N. (1986). The computer attitude scale. Computers in Human Behavior, 2, 301-306.

Panero, J.C., Lane, D. M., & Napier, H. Al. (1997). The computer use scale: four dimensions of how people use computers. Journal of Educational Computing Research, 16 (4), 297-315.

Pope-Davis, D. B., & Twing, J. S. (1991). The effects of age, gender, and experience on measures of attitude regarding computers. Computers in Human Behavior, 7, 333-339.

Poplin, M. S., Drew, D. E., & Bable, R. S. (1984). Manual for the computer aptitude, literacy, and interest profile. Austin, TX: PRO-ED.

Potosky, D., & Bobko, P. (1998). The computer understanding and experience scale – A self-report measure of computer experience. Computers in Human Behavior, 14 (2), 337-348.

Prumper, J., Zapf, D., Brodbeck, R. C., & Frese, M. (1992). Some surprising differences between novice and expert errors in computerized office work. Behaviour and Information Technology, 11, 319-328.

Rawstorne, P., Caputi, P., & Smith, B. L. (1998). A study of the psychometric properties of the subjective computer experience scale: Working Paper 1. Unpublished manuscript, University of Wollongong, Wollongong, Australia.

Rhodes, L. A. (1986). On computers, personal styles, and being human: A conversation with Sherry Turkle. Educational Leadership, 43 (6), 12-16.

Shashaani, L. (1994). Gender-differences in computer experience and its influence on computer attitudes. Journal of Educational Computing Research, 11 (4), 347-367.

Simonson, M. R., Maurer, M., Montag-Toradrdi, M., & Whitaker, M. (1987). Development of a standardized test of computer literacy and a computer anxiety index. Journal of Educational Computing Research, 3 (2), 231-247.

Sit, R. A., & Fisk, A. D. (1999). Age-related performance in a multiple-task environment. Human Factors, 41 (1), 26-34.

Smith, B. L., Caputi, P., & Rawstorne, P. (2000). Differentiating computer experience and attitudes toward computers: an empirical investigation. Computers in Human Behavior, 16 (1), 59-81.

Smith, B. L., Caputi, P., Crittenden, M., Jayasuriya, R., & Rawstorne, P. (1999). A review of the construct of computer experience. Computers in Human Behavior, 15, 227-424.

Todman, J., & Monaghan, E. (1994). Qualitative differences in computer experience, computer anxiety, and students use of computers: a path model. Computers in Human Behavior, 10 (4), 529-539.

Torardi, M. M. (1985). The development of a computer literacy assessment instrument. Paper presented at the Annual Convention of the Association for Educational Communications and Technology, Anaheim, CA, January 17-23. Available at ED 256342.

Torkzadeh, G., & Koufteros, X. (1994). Factorial validity of a computer self-efficacy scale and the impact of computer training. Educational and psychological measurement, 54 (3), 813.

Watt, D. H. (1980). Computer literacy: what should schools be doing about this? Classroom Computer News, 1 (2), 1-26.

Woodrow, J. E. J. (1991). A comparison of four computer attitude scales. Journal of Educational Computing Research, 7 (2), 165-187.


Bunz, Ulla K. ; Institution: Communication Studies, University of Kansas
Article (version: 25/06/2002 - 07:47, size: 30479)
"The Website Assignment as a Valuable Exercise - Beyond Establishing Presence to Creating Significance."
German: As the Internet is becoming more and more of a common place technology in the western world, many communication programs have begun to offer technology related communication courses. Usually, these classes require the students to create a website. Unfortunately, many times little time is spent on preparing the students adequately for this assignment, resulting in low-quality websites. Good writing is more than putting words on paper, and a good website requires more than colored text, a few graphics and a few links. This paper explores the website assignment as a valuable exercise. First, theoretical background is reviewed, as both students and instructors should be familiar with some of these concepts before creating a website. Second, a seven-step model is explained that forces students to think about their website before actually creating it. Personal experience has proven that combining the background information and the seven steps leads to higher quality websites that students are not afraid to show potential employers.

THEORETICAL BACKGROUND

Web Credibility

Credibility on the World Wide Web involves more than large numbers of people downloading the information provided on a website. This is easily measurable and can offer comforting data in form of hits, which some (Paine, cited in Holtz, 1999) define as "an acronym for How Idiots Track Success."

Cutlip, Center and Broom’s (1985) definition of credibility in the public relations context suits itself well for a general online context, too. The authors state, "The credibility of the communicator is determined by a person’s intentions, trustworthiness, and expertness, as these qualities are perceived by the target audience." On the Internet, credibility refers to a number of factors, such as the currency of its imagery, the perceived trustworthiness of the source, or the perceived trustworthiness of the information itself.

As to measuring the perceived credibility of a website, there is much talk, but comparatively little research. The literature agrees that trust is a major issue online, and beyond simple WebTrust security issues that McKeon (1998) and Borkowski (1998) discuss. Usually, in interactions, trust is the result of experience, and thus, some of the same rules apply online and offline. These include background checks on both people and organizations, providing personal information sparingly, and checking for privacy statements (Goldberg 1998). But beyond just trusting the information providers, the web credibility issue also refers to the actual credibility of the information itself. In printed academic journals peer review is common to prevent the spread of false or unqualified information. Though these journals are developing online too, most website information remains un-reviewed. Due to the pure volume of this information, the Internet user can easily fall prey to false information. The source doesn’t even always have to be bad intention, but simply may not know better.

In general, the surprisingly sparse literature on web credibility is divided into two fields. One field, mostly librarians, researches the quality of writing and the content of written sources provided. Kirk (1996) establishes six criteria for this kind of credibility under the guideline of caveat lector (Let the reader beware). They include checking for authorship, publishing body, point of view/bias, literature, accuracy, and currency. He also says that if something seems too good to be true, it probably is.

The other field concerned with web credibility is non-literary. Most websites including all the commercial websites fall into this category. In a widely quoted article Alexander and Tate (1999) and also Rettig and LaGuardia (1999) define criteria that should help establish the credibility of such a site. These include: authority, accuracy, objectivity, currency, audience, interaction features, content, design, usability and medium. Alexander and Tate also recommend to look at some specific usability issues such as the page titles and URL’s because they tell users about the source, the use of frames, and features such as site maps and internal search engines. The problem is that even pages that follow all these criteria may appear very credible, while really are phony (Critchfield 1998).

So, while there is awareness, there is no solution as of yet. Web users must rely on their own critical thinking abilities, experience, and recommendations from sources they trust because they have established their expertise in the field of interest.

Usability and Design Principles

The term "usability" was well chosen, because the concept behind it is just that, the ability to use. More specifically, usability describes the ease of use a website provides. Usability is not a web specific term, but has been applied to the web for several years now. It really implies two components, format and design, but most people who talk about usability refer only to the design part.

The format usability part is closely related to the way librarians and writers describe literary credibility online. Of course, as Critchfield (1998) points out, a well designed website appears more credible, regardless of true credibility of the information provided. But Morkes and Nielsen (1997) discuss some criteria that will help text online to have usability beyond credible content. For example, the authors point out that people online do not read, but they scan. Thus, text and pages both should be kept short and concise. The writing style should contain factual information. People will simply not read very much online. Conventional writing guidelines still apply, such as organization into paragraphs, etc., but Morkes and Nielsen recommend using summaries and the inverted pyramid style where specific information comes last. Internal search engines are also useful for searching text, and with these we are entering the domain of the design part of usability.

Binstock (1999) points out that designs need to be intuitive. This is strongly supported by Krug (2000). To Binstock, navigation and content are part of design, while Nielsen (2000) separates them. In any case, a web designer must create his or her page knowing what users will expect from the site, how they will access it, for what reasons, and how they will move within it. Testing is absolutely crucial, as Binstock (1999) points out. He recommends not letting testing confirm design, but to let it lead design. In a way, a website is never finished, and the usability of the site changes constantly, simply because users change.

Nielsen (2000) has analyzed a variety of websites over years, monitoring their development and design changes. One lesson many successful sites have learned is to use screen real estate wisely. Screen real estate refers to the space visible on the screen, and far too often most space is taken up for advertisements, navigational devices, and window controls, leaving little space for actual content. Others completely clutter their pages. Nielsen points out that white space is not bad if it is used for a purpose, such as assuring cross platform and resolution independent design.

As pointed out, internal search engines are looked upon favorably by users, and they are considered to provide usability. The reason is convenience. Of course, as Nielsen (2000) points out, the way results are reported is important, because it provides much information about the structure of the site. Just as search engines, links help people navigate within the site, and they can provide credibility by providing outside information. As Spool (1997) points out, users use text links before they click on images, and the graphic design of those images actually has little effect on usability. The better one can predict what links lead to, the easier it is to find desired information, and thus, the higher the usability. Spool makes an interesting observation. He says that browsing and information seeking are two completely different activities, and thus preference and usability assessments don’t always match.

Instone (1997) provides a nine step usability list. 1) Visibility of the system status refers to knowing where I am and where I can go next. Site maps, page titles and the like help here. 2) Match between the system and the real world is reached through using lay language and a logical order of information that doesn’t necessarily reflect the organization of the organization. 3) Use control and freedom is given through variable screen width and fonts, a home button etc. 4) Consistency and standards in visual patterns, titles, headers, and design helps navigation and understanding. 5) Error prevention requires continuous updating and testing of the website. 6) Recognition rather than recall means to include instructions, repeat buttons and links, provide site maps and image maps. 7) Flexibility and efficiency of use is given through not using frames, easy bookmark titles, long-term URL’s etc. 8) Aesthetic and minimalist design means that simple is better, and that less pertinent information should be linked at progressive levels of detail. 9) Help functions should be designed to offer solutions rather simply stating that there is a problem.

Probably one of the most important lessons to understand concerning usability is that usability is never perfect, and never finished. To achieve usability on a site, it has to be tested and improved constantly.

Visual Rhetoric

Visual rhetoric as a field is developing, especially with a focus on art. In the online context, some well known rhetorical principles can be applied easily without requiring art education.

One example are Aristotle’s three means of persuasion, ethos, pathos, and logos, which are taught in any Liberal Arts Public Speaking course. Logos, originally referring to logic, equally refers to logical construction of a site. Is information located where it would b expected? Is navigation through the site intuitive? Ethos in the Aristotelian sense refers to the credibility of the speaker. In the online context, ethos refers more to the credibility of both information and owner of the website. Who are the sources for the information presented? Is text written well? Pathos refers to emotion and liking, and in the online context can be compared to the "warm fuzzy" feeling that people get when looking at a website. Do users return to a site because they like it? Is the site visually appealing?

Rhetoric here has less to do with linguistic or discursive formations, and more with a combination of usability notions such as format and design with emotion. An example may be a Usenet site that has much logos, as information is arranged logically in threads, much ethos, as information is provided by people who may be friends, but little pathos, as the site itself, disregarding the content, is comparatively boring in its black-and-white text-only design.

However, visual rhetoric is more than principles of speech applied to a visual context. One of the particular strengths of visual rhetoric is the way in which it can express metaphor and even form community. The power of metaphor lies in connecting an unfamiliar concept, service or product with something familiar. Here, this combination is of something visual and something linguistic. Good examples are the metaphors that are used to describe the Internet, such as "Information highway," "Cyberspace," or "surfing the Net," and "downloading."

In the online context, a visual cue or symbol, usually culturally biases, reminds the viewer of a familiar concept, stimulating symbolic meaning, such as the dove representing peace, or the stature of liberty representing freedom. In this way, visual metaphors use a concrete form to represent abstract ideas. Online examples are the a house icon to represent "go to the homepage," or the email icon to represent "send me a message."

Through metaphorical means, visual rhetoric can create community. Historically, a community was a group of people living in the same town or neighborhood. Today, the Internet has collapsed all geographic boundaries and allowed the creation of "virtual communities," communities of people scattered worldwide who meet in an electronic environment to exchange ideas, share common resources and offer each other support.

This feeling of community is usually created through a combination of both language and visual aids. For example, using inclusive language or providing feedback options such as the email address or personalizing sites with the help of cookies are more linguistic devices. Membership only pages or "other people who bought this book" on Amazon.com are combination examples, and the use of school colors, logos, or photographs are visual means.

The combination of form and color is a specifically successful visual rhetoric device. In general, color focuses attention, reveals organization, and makes things more interesting and realistic. However, color can also interfere through association. It can distract, tire the eyes, and is unpredictable as it is displayed slightly differently on different computers. A yellow circle on a white background doesn’t signify much, but in context and displayed on a blue background, it immediately signified "sun."

Thus, when creating a website, one must pay close attention to messages implied in certain colors by themselves or in combination with others, the form of any graphics, the arrangement of information on a site, and the combination of text and graphic to send unified messages.

 

WEBSITE ASSIGNMENT

Technology classes in communication programs are abounding. Some are more theoretical, some more practical. Some take a technical perspective, others a rhetorical. Despite numerous differences in the make-up of these technology classes, many have one thing in common: the website assignment. Conveniently, this assignment can be sold as a "real world" application exercise with the goal of making it more attractive to the students. After teaching ten technology classes in the past four semesters, I have learned that most students are eager to learn how to make a website, but unless the assignment is carefully crafted and directed by the instructor, the students gain little more than technical expertise at a very low level.

The main problem with the website assignment is the time allowed for its completion. The website is usually not the only assignment in the class, but in order to create even basic websites, a number of skills must be taught, such as a graphical website design program or basic HTML code, navigation of the web for information retrieval, and a file transfer protocol (FTP) program to upload the sites. If the instructor wants the sites to have any level of sophistication, usually a the basics of scanning and a graphics program must be taught, plus lectures of conceptual issues such as web credibility, usability, audience targeted message design, visual rhetoric and visual design. Finally, class time must be allowed for students to work on their websites. However, even this level of commitment does not always lead to "good" sites, as I have also learned from experience. Unfortunately, once uploaded most student sites are still immediately identifiable as such.

The goal, then, is to turn the website assignment into a task that is enjoyable for the students, and manageable for the instructor during the time allowed. As the end result of the assignment will be publicly available, students ought to be proud of their work, rather than regarding it as "just another assignment completed." Ideally, students will learn not just how to create a website, but also understand how to direct the communicative power such a document can have.

The most successful strategy according to my experience is based on van Hoosier-Carey’s (1997) recommendations. Van Hoosier-Care describes the website assignment as a rhetorical exercise in the technical communication classroom. To him, the website truly is a written rhetorical document whose graphical elements are less important than the message they send. I disagree with him on this account. However, many of the recommendations he makes are what has evolved in my classroom as effective solutions to problems resulting from "just another assignment" and "let’s just upload the site for now" attitudes.

One of the first problems are the seemingly different goals of instructor and students. These goals are not actually opposites, but may seem difficult to combine. Instructors want to teach students both technical and communicative or rhetorical skills. The website assignment seems a suitable tool as knowing how to create a website is heralded as the new "skill to have" for the job market for communication graduates. Students often are eager to learn how to make a website, but get frustrated easily by details. In order to save time, they often forego slightly more effective, visually more pleasing, and rhetorically more persuasive websites for those which, in technological terms, can be compared to the drawings of five-year olds.

A combined goal can be reached simply by structuring the assignment in a slightly different way. The following paragraphs will discuss each step in making the website assignment a valuable exercise.

  • Step 1 – Lecture
  • Step 2 – Analysis exercise
  • Step 3 – Conceptualizing the website
  • Step 4 – Preparing the design
  • Step 5 – Analysis exercise
  • Step 6 – Designing the website
  • Step 7 – Presenting and redesigning the website

Step 1 – Lecture

When grammar school children learn how to read, they are not presented with a copy of Homer and asked to "figure out" the rest for themselves. Instead, they learn the letters of the alphabet first. Similarly, students about to design a website must be taught the principles that make up a website, the conceptual issues. In two or three one-hour lectures principles of web credibility, usability, and visual rhetoric can be discussed with references to other topics such as intellectual property, graphic design, and audience targeted message design. It helps to consistently show website examples that apply these principles to varying degrees, so that students can learn how to spot both good and bad examples. As Spool (1997) points out, a website can look beautiful, yet fail to convey any meaning. By following the lecture, the students’ view is sharpened from the website as a whole to the components and the thought that went into the creation of a website.

Step 2 – Analysis Exercise

Directly following the days of lecture, students are given a homework assignment. The instructor provides each one with a website address and asks the students to analyze the website according to the principles discussed in class. These websites can be chosen arbitrarily, but some should be "good" and some should be "bad" examples. About four to six students should always be given the same website address. During the next class session, the class is divided into small groups depending on website reviewed. Students are asked to share their observations. Usually, 15 minutes are enough for this part of the exercise. The remaining class time is spent on showing each website to the whole class while the group that reviewed this site shares their criticism or praise of these sites. The purpose of this exercise is to practice the theoretical skills acquired through lecture, but also to give students possible examples and ideas of what they want their own websites to look like or not.

Step 3 – Conceptualizing the Website

At this point, students usually want to begin designing their website by sitting down at the computer and typing in HTML code or using a graphical user interface program. Instead, students must remain in their project groups and begin the conceptual process of designing a website. As December and Ginsburg (1995, pp. 130-132) point out, this consists of:

  • The rationale for the project – why it is needed, whether it adds information or services not available from existing sites.
  • The target audience(s) – who potential users are, what characteristics or interests they share.
  • The website’s purpose – what service(s) the site aims to provide for the audience, what level of information detail or complexity is appropriate to the audience.
  • The website’s objective – what output the website needs to provide for the audience in order to carry out its purpose.
  • The website’s subject domain – what information the development team needs in order to make informed choices about the site’s design and content.

If possible, students should be given a class session to talk about these issues. At this point, the instructor also should talk to each group and provide feedback. If no class time can be spared for this step and groups are required to meet outside the classroom, each group should make an appointment with the instructor for feedback purposes. Students tend to try to skip this step, but it is vitally important to understand these underlying conceptual issues, as otherwise the website will fail to communicate anything other than "This was a class assignment."

Step 4 – Preparing the Design

Closely related and possibly intertwined with the conceptualization of the website is its preparation on paper. Students should be required to prepare a story board for their website, drawing the connections and links between pages, and the graphical arrangement of text and image for each page. No great artistic skill is required, as the main purpose of this step is to understand the site’s functionality, and not to present its beauty.

Step 5 – Analysis Exercise

Just as in the previous analysis exercise, the purpose is to detect strengths and weaknesses. The difference is that before, arbitrary online sites were analyzed. This time, each group presents their results from Step Three and Four, defending their ideas before the class. Feedback and criticism from the class help greatly to improve the site, as many times class members notice what team members have overlooked, as van Hoosier-Carey (1997) also points out.

Step 6 – Designing the website

If this has not happened yet, students can be taught how to use the basics of a website development program in two or three class sessions. As they already have their designs in mind, the learning process is more rapid, because students automatically apply the new skills to their individual needs. Students will require about two class sessions to put the website together. Most of the work has already been done on paper, so lengthy discussions on where to find link addresses or what images to include will not hinder the technical process.

Step 7 – Presenting and Redesigning the Website

No website is ever perfect, and no good website is ever finished. Instead, websites should be thought of as processes in constant evolution. When the students have completed the website design step and have uploaded their site, they deserve to present their work in class once again, this time with the seemingly finished project. However, many times little kinks need to be fixed, or ideas that worked conceptually cause problems in application. The presentation of the website should be thought of as the final rehearsal. Students should be encouraged to make repairs and minor changes before supplying the instructor with the URL of their site for grading.

CONCLUSION

The seven steps discussed present a simple but effective plan of turning the website assignment into a useful project. Adding a few simple requirements such as the conceptualization stage and the paper design stage do not require much time, but result in higher quality websites. As communication scholars, we should be concerned with the messages we sent out to the Internet. In technical writing courses, a sloppy memo with formatting errors would never be accepted. Uploading a website with poor navigation or no conceptual backbone is the online version of a sloppy memo.

The website assignment allows the unique opportunity to combine theory with application in a way satisfying both to the instructor and to the students. However, just as a website needs a purpose, the website assignment needs to have a purpose beyond simply being an "assignment." Hopefully, the content and tips provided in this paper will help to develop and implement website assignments as valuable exercises, leaving behind websites that are there just to establish presence.

 

REFERENCES

Adler, P. (Ed.) (1992). Usability: turning technologies into tools. New York: Oxford University Press.

Alexander, J. E., & Tate, M. A. (1999). Web wisdom: how to evaluate and create information quality on the web. New Jersey: Lawrence Erlbaum Associates.

Borkowski, M. (1998). Credibility key to e-commerce. Canadian Electronics, 13 (7), 4.

Coe, M. (1996). Human factors for technical communicators. New York: John Wiley & Sons.

Critchfield, R. (1998). Credibility and web site design. Available at http://www.warner.edu/critchfield/hci/critchfield.html

Cutlip, S. M., Center, A. H., & Broom, G. M. (1985). Effective public relations. 6th Ed. Englewood Cliffs, NJ: Prentice Hall.

December, J., & Ginsburg, M. (1995). HTML and CGI unleashed. Indianapolis, IN: Sams.net.

Dennison, R. F. (1999). Web searching – A group project. The Technology Teacher, 58 (8), 6.

Dillon, A. (1994). Designing usable electronic text. Southport: Burgess Science Press.

Goldberg, B. (1998). Is trust different in cyberspace? Executive Excellence, 15 (11), 15-16.

Goubil-Gambrell, P. (1996). Designing effective Internet assignments in introductory technical communication courses. IEEE Transactions on Professional Communication, 39, 224-231.

 

Hix, D., & Schulman, R. S. (1991). Human-computer interface development tools: a methodology for their evaluation. Communications of the ACM, 34 (3), 74-87.

Holtz, S. (1999). Public relations on the net. New York: Amacom.

Holtze, T. L. (2000). Applying learning style theory to web page design. Internet Reference Services Quarterly, 5 (2), 71.

Jordan, P. W. (1998). An introduction to usability. Bristol, PA: Taylor & Francis.

Kaufer, D. S., & Butler, B. S. (1996). Rhetoric and the arts of design. Mahwah, NJ: Erlbaum.

Kirk, E. (1996). Evaluating information found on the Internet. Available at http://milton.mse.jhu.edu:8001/research/education/net.html

Kostelnick, C. (1996). Supra-textual design: the visual rhetoric of whole documents. Technical Communication Quarterly, 5, 9-33.

Krug, S. (2000). Don’t make me think!: a common sense approach to web usability. Indianapolis, IN: Que.

Mayhew, D. (1999). The usability engineering lifecycle: a practitioner’s handbook for user interface design. San Francisco, CA: Morgan Kaufmann.

McKeon, P. (1998). Electronic commerce--bridging the security gap with WebTrust. Accountancy Ireland, 30 (3), 12-13.

Nielsen, J. (1993). Usability Engineering. Boston, MA: AP Professional.

Nielsen, J. (2000). Designing web usability. Indianapolis, IN: New Riders.

Norman, D. (1988). The design of everyday things. New York: Doubleday.

Radosevich, L. (1997, December). Fixing web-site usability. InfoWorld, 19 (50), 81-82.

Rettig, J., & LaGuardia, C. (1999, July/August). Beyond ‘beyond cool’: reviewing web resources. Online, 23 (4), 51-55.

Rubin, J. (1994). Handbook of usability testing: how to plan, design and conduct effective tests. New York: John Wiley & Sons.

Scarcella, J. A. (1999). Web authoring – How do I get started? The Technology Teacher, 59 (1), 13.

Scarcella, J. A. (1999). Web authoring – How do I get started? The Technology Teacher, 59 (1), 13.

Schriver, K. A. (1997). Dynamics in document design. New York: John Wile.

Spool, J. (1997). Web site usability: a designer’s guide. North Andover, MA: User Interface Engineering.

Van der Meij, H. (1997). The ISTE approach to usability testing. IEEE Transactions on Professional Communication, 40 (3), 209-223.

Van Hoosier-Carey, G. (1997). Rhetoric by design: using web development projects in the technical communication classroom. Computers and Composition, 14 (3), 395-407.

Virzi, R. A. (1992). Refining the test phase of usability evaluation: how many subjects is enough? Human Factors, 34 (4), 457-468.

Wagner, P. D., & Wagner, T. A. (1997). The world wide web in the classroom. The Technology Teacher, 56 (5), 22.

Witmer, D. F. (1998). Introduction to computer-mediated communication: a master syllabus for teaching communication technology. Communication Education, 47 (2), 162.


Cornelius, Caroline ; Institution: eResult GmbH - eCommerce Research & Consulting, Göttingen
Article (version: 25/06/2002 - 07:47, size: 18860)
"Best Match zwischen Forschungsfrage und Design von Online-Fokus-Gruppen."
German: Einleitung

Fokus-Gruppen werden in der Marktforschung immer dann durchgeführt, wenn neue Produkte, Dienstleistungen und Werbemittel entwickelt und evaluiert werden sollen und bei welchen entweder die Bedürfnisse oder die Zusammensetzung der Zielgruppe unbekannt sind, so dass eine explorative und qualitative Vorgehensweise angezeigt ist. Immer wieder wird hervorgehoben, dass in Fokus-Gruppen im Vergleich zu Befragungen die Gruppendynamik genutzt werden soll, um ein möglichst grosses Spektrum an Meinungen zu erheben, wobei weitgehend ungeklärt bleibt, worin diese Gruppendynamik besteht und wie sie ausgelöst wird (vgl. z.B. Bristol & Fern, 1996; Melchers, 1994). Zeigt sich hier bereits ein theoretisches und methodologisches Defizit, verschärft sich dieses, wenn man Fokus-Gruppen online durchführen will, da Effekte der computervermittelten Kommunikation (cvK) auf die unspezifizierte "Gruppendynamik" wahrscheinlich, aber nicht vorhersagbar sind.

Die Vorteile von Online-Fokus-Gruppen im Vergleich zu Face-to-Face (FtF) werden gegenwärtig vor allem darin gesehen, dass sie zeit- und kostenökonomisch, flexibel und international durchzuführen sind. Sie wirken aufgrund des "Reiz des Neuen" (noch) als Incentive bei der Rekrutierung. Die früher aufwendig zu erstellenden Transkripte der Diskussionen werden als automatische Protokolle gleich mitgeliefert, was eine erhebliche Erleichterung der anschliessenden quantitativ-qualitativen Analyse und Ergebnispräsentation darstellt. Unerlässlich sind Online-Fokus-Gruppen in der e-Commerce-Forschung, da nur mit ihnen Websites ohne Medienbruch evaluiert werden können. Das textbasierte Medium "Computerkonferenzen" ermöglicht so Fokus-Gruppen zu einer breiteren Facette von Fragestellungen, in dichteren Zeitintervallen und/oder mit grösseren Stichproben. Auf Seiten der Auftraggeber jedoch stossen Online-Fokus-Gruppen auf eine geringe Akzeptanz, weil für diese nicht durchschaubar ist, welche Effekte das Medium auf die Qualität der Ergebnisse hat. Vorbehalte gegen Online-Fokus-Gruppen können nur dann aufgelöst werden, wenn die Marktforschung diese Effekte kontrollieren und kreativ zur Beantwortung von Fragestellungen einsetzen kann.

Die "Gruppendynamik" in Online-Fokus-Gruppen

In der Literatur hält sich die Vorstellung, dass die Teilnehmenden an Online-Fokus-Gruppen aufgrund der visuellen Anonymität mehr Offenheit im Anwortverhalten, mehr Selbstoffenbarungen und weniger soziale Erwünschtheit zeigen als in FtF-Gruppen (Joinson, 2001). Dabei wird jedoch übersehen, dass nicht Merkmale des Mediums per se zu diesen Gruppenergebnissen führen, sondern dass spezifische Variablen im Design der Online-Fokus-Gruppen oben genannte Effekte hervorrufen aber auch unterdrücken können. Entscheidender als das Medienmerkmal "visuelle Anonymität" ist das Ausmaß an psychologischer Anonymität, welche gezielt und fein abgestuft manipuliert werden kann, eben weil sich die Teilnehmenden nicht sehen und hören können (Postmes, Spears & Lea, 1999). So kann entsprechend der Fragestellung entschieden werden, ob keine, falsche oder persönliche Informationen über die anderen Teilnehmenden gegeben werden sollen. In FtF wirken ideosynkratische Merkmale von Gruppenmitgliedern, wie z.B. Attraktivität oder Charisma, auf die Gruppendynamik und erschweren deren Vorhersage. Diese Merkmale sind in cvK ausgefiltert oder abgeschwächt, so dass soziale Kontexthinweise eine höhere Relevanz gewinnen als in FtF. Je nachdem, ob diese Hinweise Informationen über den sozialen Status und die Zugehörigkeit zu einer sozialen Gruppe oder persönliche Informationen geben, sehen sich die Teilnehmenden als Vertreter sozialer Kategorien und als homogene Gruppe oder als unterscheidbare Individuen.

Bislang zeigt weder die FtF- noch die cvK-Gruppenforschung, dass Gruppendiskussionen Meinungsvielfalt und Divergenz fördern, aber unzählige Studien und Praktiker berichten, dass Gruppenprozesse dazu tendieren zu konvergieren. So tritt in Fokus-Gruppen häufig das Phänomen auf, dass sich "schweigende Mehrheiten" bilden, die einem "Vielredner" zustimmen (Lamnek, 1998). Während in FtF-Gruppen diese Konvergenz als Konformität mit einem attraktiven oder statushöheren Gruppenmitglied oder der Majorität auftritt, tritt sie in cvK-Gruppen als Orientierung an der jeweils relevanten Gruppennorm auf, welche den Teilnehmenden zugänglich gemacht wurde (Postmes et al., 1999). In der Marktforschung gibt es jedoch nur wenige Bereiche, in welchen eine solche Konvergenz der Einstellungen der Fragestellung angemessen ist. Der breiteste Anwendungsbereich von Fokus-Gruppen findet sich in der Evaluation von neu entwickelten Produkten und Dienstleistungen, wobei viele und unterschiedliche Meinungen und Einstellungen erhoben werden sollen.

Die Optimierung der Passung zwischen Fragestellung und Design

Der zentrale Vorteil von Online-Fokus-Gruppen gegenüber FtF-Fokus-Gruppen, nämlich die gezielte Manipulation eines Gruppenkontexts zur Optimierung der Passung zwischen Fragestellung und Design, wurde in der Marktforschung bisher noch nicht erkannt und genutzt. Die Fragestellung determiniert auf der einen Seite, welche Ergebnisse von einer Gruppe erwartet werden und auf der anderen Seite, welche Ressourcen die Gruppe benötigt, um diese Ergebnisse zu erzielen. Die vier häufigsten Fragestellungen der Marktforschung sind im Bereich der Entwicklung die Ideenfindung und das Lösen von Problemen, und im Bereich der Evaluation die Erhebung von Meinungen und Einstellungen zu Produkten, Dienstleistungen und Werbemitteln und die Erhebung von Werten und Normen einer Zielgruppe.

In einem Kreismodell können der jeweiligen Fragestellung Gestaltungsempfehlungen von Fokus-Gruppen zugeordnet werden, welche die Passung von Gruppenkontext und -ergebnissen erhöhen. Dies geschieht in Anlehnung an das Group Task Circumplex Modell von McGrath (1984), welches zunächst Gruppenaufgaben in motorische, kreative, intellektuelle Aufgaben oder Verhandlungsaufgaben unterscheidet, um dann die spezifischen Anforderungen zu beschreiben, welche die jeweilige Aufgabe an die Gruppe stellt. Das Kreismodell zur Optimierung der Passung zwischen Fragestellung und Design von Fokus-Gruppen unterscheidet hingegen zwischen Fragestellungen im Bereich der Entwicklung (Ideenfindung und Problemlösen) und der Evaluation (Erhebung von Einstellungen und von Werten und Normen), um dann den spezifischen Gruppenkontext zu beschreiben, welcher die Produktivität der Gruppe erhöht (siehe Abbildung).

Als Faktoren, welche die Produktivität in Abhängigkeit von der Fragestellung erhöhen oder reduzieren können, wurden die Gruppenzusammensetzung, die Anonymität, die Kommunikationsqualität und die Moderationsmethode ausgewählt. Diese Faktoren sind in Bezug auf die Fragestellungen und das Medium bereits untersucht wurden, so dass Gestaltungsempfehlungen auf einer empirischen Basis möglich sind.

Die folgenden Designs für die Fragestellungen Problemlösen, Ideenfindung, Bewertung und Erhebung von Werten und Normen einer Zielgruppe werden an Beispielen aus der e-Commerce-Marktforschung dargestellt. In diesem Anwendungsbereich können Online-Fokus-Gruppen am elegantesten umgesetzt werden, auch wenn weitere Anwendungsfelder bereits erschlossen werden.

Problemlösen bei der Entwicklung eines Produkts oder einer Dienstleistung

Online-Fokus-Gruppen bieten sich an, wenn räumlich getrennte Expert/innen z.B. ein Problem bei der Entwicklung einer Software oder der Einrichtung eines Internet-Portals lösen sollen. Die Gruppenzusammensetzung sollte nach dem Merkmal Expertise heterogen sein, um den potentiellen Leistungsvorteil der Gruppe gegenüber dem einzelnen Individuum tatsächlich nutzen zu können (Boos & Sassenberg, 2000). Die Heterogenität kann jedoch leistungsmindernd wirken, wenn Status, Geschlecht etc. die Einflussmöglichkeiten auf die Lösung behindern. Deshalb sollte Bekanntheit zwischen den Gruppenmitgliedern hergestellt werden, indem individuierende Information über ihre Expertise gegeben wird, ansonsten aber die Anonymität aufrecht erhalten werden (Wood & Karten, 1986). Der Leistungsvorteil einer heterogenen Expertenrunde besteht im wechselseitigen Fehlerausgleich und in einer verstärkten Auseinandersetzung mit der Aufgabe aufgrund der konfligierenden Meinungen. Je divergenter jedoch die Problemrepräsentation in der Gruppe, desto aufwendiger ist der Kommunikationsprozess, um eine Übereinstimmung hinsichtlich der Problemlösung herzustellen. Der Kommunikationsprozess sollte deshalb durch eine Steigerung der Kommunikationsqualität mit Hilfe eines vorgeschalteten Chat-Trainings und einer strukturierenden Moderationstechnik unterstützt werden. Bei der Durchführung von Expertenrunden haben sich Softwarelösungen für die Gruppenarbeit bewährt, welche die Visualisierung von Problemfeldern und die Abstimmung unterstützen, wie z.B. die Metaplan- oder die Delphi-Technik, sowieso neuere Mediationstechniken.

Ideenfindung bei der Entwicklung einer Website

Wenn noch keine Beta-Version einer Website vorliegt, sondern es darum geht, möglichst viele kreative Ideen von möglichst unterschiedlichen Expert/innen oder Zielgruppenmitgliedern zu sammeln, sind Online-Fokus-Gruppen besonders empfehlenswert. Die Gruppenzusammensetzung sollte möglichst heterogen sein, um die Diversität zu fördern. Die visuelle Anonymität des Mediums sollte so genutzt werden, dass Bewertungsängste reduziert werden. Die größte Menge an Ideen ist zu erwarten, wenn Ideen nicht durch andere Gruppenmitglieder rezipiert oder bewertet werden, so dass die Produktionsblockierung in Gruppen reduziert wird (Diehl & Stroebe, 1991). Das Medium Computerkonferenzen zeichnet sich dadurch aus, dass aufgrund des Tippaufwandes und der Simultanität eine hohe kognitive Belastung entsteht, welche die Rezeption der Nachrichten von anderen Gruppenmitgliedern und die Bezugnahme auf diese drastisch reduziert. Im Gegensatz zur Produktionsblockierung in FtF tritt in cvK eine Aufmerksamkeitsblockierung auf, deren Effekt auf die Ideengenerierung vorteilhaft und nur für Problemlöse- und Entscheidungsfindungsgruppen problematisch ist (Straus, 1996). Deshalb sollte auf jede Intervention durch Trainings zur Steigerung der Medienkompetenz verzichtet werden, welche die Kommunikationsqualität und damit die Rezeption und die Bewertung von Ideen der anderen Gruppenmitglieder steigern könnte. Auch eine Moderation ist überflüssig, da weder eine Strukturierung anhand eines Leitfadens noch eine Unterstützung des Gesprächs zur Erhöhung der Kommunikationsqualität erforderlich sind. Die Ideensammlung sollte lediglich angeregt und auf ein Thema fokussiert werden, indem eine Zielsetzung vorgegeben wird. Teilnehmende an Computerkonferenzen orientieren sich zwar weniger an den Gesprächsbeiträgen der anderen Gruppenmitglieder, aber dafür um so stärker an einer vorgegebenen Makrostruktur bzw. an einem Thema (Matheson, 1992).

Erhebung von Einstellungen am Beispiel "Evaluation einer Website"

Wenn der Prototyp einer Website vorhanden ist oder der Relaunch einer bereits etablierten Website bevorsteht, können Online-Fokus-Gruppen als ein Modul in eine Usability-Studie integriert werden. Da bei dieser Fragestellung ein möglichst großes Spektrum an Meinungen und Bewertungen erhoben werden soll und eine kontroverse Diskussion ohne die sonst in Gruppen auftretende Konformitätsneigung erwünscht ist, sollte die Gruppe so heterogen wie möglich zusammengesetzt sein und als einzelne Individuen mit einer hohen Qualität kommunizieren. Heterogenität kann nach den Variablen Geschlecht, Alter, Familienstand, sozioökonomischer Status, Bildung, Expertise, Ethnizität und sexueller Orientierung hergestellt werden. Optimal ist eine Mischung, welche den Merkmalen verschiedener Zielgruppen entspricht. Damit sich die Teilnehmenden nicht als homogene Gruppe sondern als Individuen wahrnehmen, sollten sie in einer Vorstellungsrunde miteinander vertraut gemacht werden. Bekanntheit kann z.B. durch die Gabe biographischer Informationen hergestellt werden (Rezabek, 2000), welche aber nicht die Zugehörigkeit zu einer sozialen Kategorie salient machen sollten, wie z.B. die Angabe von "typisch weiblichen" oder "typisch männlichen" Hobbys (Postmes et al., 1999). Medienangepasstes Kommunikationsverhalten muss trainiert werden, damit die Simultanität des Mediums nicht zu konversationalen Chaos führt (Cornelius, 2001). In Chats treffen Nachrichten nicht in der intendierten Reihenfolge der Sender/innen ein, sondern im linearen Verarbeitungsmodus des Programms. Aufgrund der visuellen Anonymität können Gespräche nicht nonverbal reguliert werden. Wenn sich die Teilnehmenden nicht an das Medium anpassen, indem sie explizite verbale Bezüge auf Personen und Themen herstellen, kann kein gegenseitiges Verständnis stattfinden. Dies lässt sich jedoch effizient durch ein kurzes Chat-Training ausgleichen. Um es dem Moderator zu ermöglichen, auf den thematischen Leitfaden und die Inhalte zu fokussieren, kann ein Ko-Moderator zur Gesprächskoordination eingesetzt werden. Diese/r kann das gegenseitige Verständnis und letztlich auch die Lesbarkeit der Protokolle noch weiter steigern, indem er oder sie gesprächsfördernde Verhaltensweisen, wie Nachfragen, Spiegeln, Zusammenfassen etc., ausübt. Sowohl die Vertrautheit als auch die erhöhte Kommunikationsqualität steigern die Divergenz und die Diversität der Einstellungen.

Erhebung der Normen und Werte einer Zielgruppe

Wenn die Normen und Werte einer bereits definierten aber weitgehend unbekannten Zielgruppe erhoben werden sollen, um eine Marketingstrategie zu entwickeln oder der Kontakt zum Kunden verloren gegangen ist, wird empfohlen, die Online-Fokus-Gruppe homogen nach dem für die Zielgruppe relevanten Merkmal zusammen zu setzen (z.B. entsprechender Medienkonsum bei Splatter-Film-Fans). Die Gruppenmitglieder dürfen vor der Diskussion nicht miteinander vertraut gemacht werden, es darf keine biographische Information über sie gegeben werden und sie sollten sich über Pseudonyme einloggen, welche ihre Zugehörigkeit zur Ingroup salient machen. Die so hergestellte Anonymität erhöht die Orientierung an Gruppennormen (Postmes et al., 1999). Eine Erhöhung der Kommunikationsqualität durch ein Chat-Training oder Moderationstechnik sind nicht notwendig, weil es in solchen Gruppen allein auf die wahrgenommene Gruppenzugehörigkeit und nicht wie in Gruppen, die auf persönlichen Beziehungen basieren, auf die Kommunikationsqualität ankommt (Prentice, Miller & Lightdale, 1994). Da die Moderation aufgrund fehlender Information nicht an die Normen und Werte der Zielgruppe angepasst werden kann, sollte auf sie verzichtet werden. Ein Moderator oder eine Moderatorin, welche/r schnell als Mitglied der Outgroup erkannt wird, schadet der Diskussion mehr, als dass er/sie sie fördern könnte. Statt dessen sollte das interessierende Thema vorgegeben werden. Vor der Diskussion kann eine gruppenbildende Maßnahme, z.B. in Form eines online-games, durchgeführt werden.

Fazit

An dieser Stelle sei nur das kurze Fazit gezogen, dass zwar jeder Teilausschnitt des Kreismodells gut untersucht ist, aber nicht das Modell im Ganzen. So wurde beispielsweise bisher nicht untersucht, ob eine hohe Kommunikationsqualität in cvK tatsächlich der Ideenfindung hinderlich ist oder die Identifikation mit der Ingroup reduziert, sondern lediglich, dass eine hohe Kommunikationsqualität für diese Anwendungsbereiche nicht erforderlich ist. Auch zum Medienvergleich FtF- und Online-Gruppendiskussionen liegen derzeit noch zu wenige Studien vor, da die Faktoren Gruppenzusammensetzung, Anonymität und Kommunikationsqualität meist nur innerhalb eines Mediums variiert worden sind.

Da Fokus-Gruppen in der Marktforschung als qualitatives Instrument eingesetzt werden und der Erkenntnisgewinn meist schon nach zwei bis drei Diskussionen gesättigt ist, können hier keine Fallzahlen entstehen, welche vergleichende, empirische Studie ermöglichen würden. So müssen Einzelergebnisse aus sozial- und kommunikationspsychologischen Studien zusammengetragen werden, die zusammengesetzt ein ausreichend klares Bild vermitteln, um das Design von Online-Fokus-Gruppen zu optimieren.

Literatur

Boos, M. & Sassenberg, K. (2000). Koordination in verteilten Arbeitsgruppen. In E. H. Witte & C. Bleich (Hrsg.), Leistungsverbesserungen in aufgabenorientierten Kleingruppen. Pabst.

Bristol, T. & Fern, E.F. (1996). Exploring the atmosphere created by focus group interviews: comparing consumers' feelings across qualitative techniques. In Journal of the Market Reserach Society, Vol 8 (2)

Cornelius, C. (2001). Gegenseitiges Verständnis in Computerkonferenzen. Voraussetzungen und Folgen konversationaler Kohärenz in Entscheidungsfindungsgruppen im Medienvergleich. Münster: Waxmann.

Diehl, M. & Stroebe, W. (1991). Productivity loss in brainstorming groups: Toward the solution of a riddle. Journal of Personality and Social Psychology, 53, 497-509.

Joinson, A. (2001). Self-disclosure in computer-mediated communication: The role of self-awareness and visual anonymity. In European Journal of Social Psychology, 31, 177-192.

Lamnek, S.(1998). Gruppendiskussion- Theorie und Praxis. Weinheim: Beltz PVU. Matheson, K. (1992). Woman and computer technology: communicating with herself. In M. Lea (Hrsg.), Contexts of computer-mediated communication (S. 66-88). New York, NY: Harvester Wheatsheaf.

McGrath, J. E. (1984). Groups: Interaction and performance. Englewood Cliffs, N.J.: Prentice-Hall.

Melchers, C.B.(1994): Gruppendiskussion in der Marktforschung. In Planung & Analyse 2/1994, S. 5-9 und S. 32-36. Postmes, T, Spears, R. & Lea, M. (1999). Social identity, normative content and 'deindividuation' in computer-mediated groups. In N. Ellemers, R. Spears & B. Doosje (Hrsg.), Social identity: context, commitment and content (S. 164-265). Oxford: Blackwell.

Prentice, D. A., Miller, D. T. & Lightdale, J. R. (1994). Asymmetries in attachments to groups and to their members: distinguishing between common-identity and common-bond groups. Journal of Personality and Social Psychology, 20(5), 484-493.

Rezabek, R.J. (2000) Online Focus Groups: Electronic discussions for research. In Forum Qualitative Sozialforschung, (1) 1, URL: http://qualitative-research.net/fqs/fqs.htm

Straus, S. G. (1996). Getting a clue. The effects of communication media and information distribution on participation and performance in computer-mediated and face-to-face groups. Small Group Research, 27(1), 115-142.

Wood, W. & Karten, S. J. (1986). Sex differences in interaction style as a product of perceived sex differences in competence. Journal of Personality and Social Psychology, 50 (2), 341-347.


Creß, Ulrike ; Barquero, Beatriz; Hesse, Friedrich W. Institution: Psychologisches Institut, Eberhard-Karls-Universität Tübingen
Article (version: 25/06/2002 - 07:47, size: 34696)
"Online-Lernmaterialien in der Hochschullehre: Wie Studierende sie nutzen und beurteilen – Ergebnisse einer Evaluationsstudie."
German: Anmeldung für einen Vortrag zur „German Online Research“ (GOR) 2001 in Göttingen

Online-Lernmaterialien in der Hochschullehre: Wie Studierende sie nutzen und beurteilen - Ergebnisse einer Evaluationsstudie

 

Creß, U., Barquero, B. & Hesse, F.W.

Universität Tübingen

Kontakt: u.cress@iwm-kmrc.de

 

Einleitung

Mit der Möglichkeit, Lernmaterialien für die Hochschullehre auch über das Internet anzubieten, verknüpfen sich derzeit hohe Erwartungen. Durch die Zeit- und  Ortsunabhängigkeit, die der Einsatz von Medien ermöglicht, erhoffen die Hochschulen, neue und breitere Zielgruppen erschließen zu können. Daneben besteht die Aussicht, die Qualität der Lehre zu verbessern, indem den Studierenden z.B. zu den Lehrveranstaltungen aktuell ergänzende Materialien online angeboten werden können, die der Vor- und Nachbereitung ihrer Arbeit dienen sollen (Tissue, Earp & Yip, 1996). In geeigneten Themenbereichen können den Studierenden darüber hinaus über das Internet interaktive Programme zur Verfügung stehen, mit deren Hilfe sie auch außerhalb des Labors eigenständig Simulationen oder Experimente durchführen können. Dadurch kann in stärkerem Maße entdeckendes Lernen gefördert werden (vgl. Rieber, 1991). Insgesamt nähert dies die Hoffnung, dass durch die neuen Medien den Studierenden ein flexibleres Lernen ermöglicht werden kann, das in höherem Maße auf ihre individuellen Bedürfnisse zugeschnitten ist, als dies bei der traditionellen Hochschullehre möglich war (Hesse & Schwan, im Druck). Diese Vorteile des Lernens mit Medien sind aber auch mit hohen Ansprüchen an den Lernenden gekoppelt (Lawless & Brown, 1997; Marchionini, 1990; Weidenmann, 1995). Diese müssen fähig sein, mit der benutzten Software zurechtzukommen, sich in dem großen Umfang der ihnen angebotenen Informationen zurechtzufinden und ihre Handlungen mit den vielfältigen Interaktionsmöglichkeiten solcher Lernmaterialien selbst zu steuern. Wenn Studierende über diese Fähigkeiten nicht verfügen oder keine geeignete Unterstützung dabei erhalten, können Schwierigkeiten auftreten, die eine optimale Nutzung dieser Lernmaterialien behindern.

 

Spezifische Stärken und Probleme, die mit den Einsatz von Online-Lernmaterialien verknüpft sind, wurden in zwei Tübinger Verbundprojekte durch eine Evaluationsstudie untersucht: das Verbundprojekt „VirtuGrade“ (7 Teilprojekte), seit 1998 vom Land Baden-Württemberg gefördert, und das Verbundprojekt „Multimediagestützter Studiengang Bioinformatik“ (7 Teilprojekte), 1999-2000 von der Deutschen Telekom und dem Land Baden-Württemberg gefördert.

 

Die in beiden Projekten entwickelten Materialien wurden in Lernszenarien angeboten, denen eine unterschiedliche Konzeption des Medieneinsatzes zugrunde liegt. Im folgenden sollen zwei Szenarien herausgegriffen werden, in denen Online-Materialien eine unterschiedliche Funktion zukommt: das Ergänzungsszenario und das Workshopszenario (vgl. das Stoffvermittlungsparadigma und das Problemlösungsparadigma in Döring, 1997). Im Ergänzungsszenario werden typische Präsenzveranstaltungen wie Vorlesung, Übung und Seminar durch die multimediale, netzbasierte Präsentation von Lerninhalten ergänzt. Diese werden zumeist als Vorlesungsskript bzw. -folien dargestellt, bestehen überwiegend aus Texten, statischen Bildern und Graphiken, enthalten aber z.T. ebenfalls Animationen, Simulationen, kleine interaktive Programme (Applets) und Videosequenzen. Die Funktion der Online-Materialien besteht in diesem Szenario vor allem darin, dass Lernende unzureichendes Vorwissen nacharbeiten und das in der Veranstaltung Präsentierte elaborieren können. In diesem Szenario stehen auch Kommunikationstools (E-Mail, Diskussionsforum, Chat) zur Verfügung, die den Studierenden ermöglichen, Fragen an Dozenten oder Kommilitonen zu stellen oder Kommentare zu den Materialien zu äußern. Die Funktion dieser Kommunikationstools steht aber im Hintergrund, da Studierenden und Dozenten vorwiegend während der Präsenzveranstaltung miteinander kommunizieren. Einen ganz anderen Stellenwert als im Ergänzungsszenario haben die Online-Materialien im Workshopszenario. Hier entfällt die wöchentliche Präsenzveranstaltung und statt dessen erstellen die Studierenden gemeinschaftlich die Lernmaterialien (quasi als „Referate“), die über das Internet der Gesamtgruppe präsentiert werden und in der (computervermittelten) Diskussion kommentiert, weiterentwickelt und verbessert werden. Bei der Zusammenarbeit der Studierenden kommt der telematischen Kommunikation eine wichtige Funktion zu. Grundlage dafür ist ein gemeinsames Repository, in welchem alle Teilnehmer Dateien lesen, bearbeiten und ablegen können. Andere Kommunikationsmittel wie E-Mail und Chat stehen den Teilnehmern ebenfalls zur Verfügung.

 

Unsere Evaluationsstudie zielte darauf, Erkenntnisse darüber zu gewinnen, wie Studierenden beider Settings die jeweiligen multimedialen Angebote nutzen und bewerten, und welche Faktoren Einfluss auf ihre Nutzung und Bewertung ausüben.

 

Evaluationsmethode

Zu Beginn jeder Lehrveranstaltung wurde den Studierenden ein Vorfragebogen zu ihren individuellen Lernvoraussetzungen ausgeteilt (Motivation zur Teilnahme an der Lehrveranstaltung, Vorwissen zum jeweiligen Lerninhalt, Computererfahrung und Einstellung zum computerunterstütztem Lernen und zur netzbasierten Kommunikation). Am Ende der Lehrveranstaltung erhielten die Studierenden einen Nachfragebogen mit Fragen bzgl. ihrer Nutzung der multimedialen Materialien und ihrer Bewertung unterschiedlicher Aspekte der besuchten Lehrveranstaltung (Gestaltungs- und Navigationsaspekte der Materialien, Aufbereitung des Lerninhalts, instruktionale Maßnahmen wie Visualisierungen und Hilfestellungen, gestellte Lernaufgaben und erhaltene Betreuung). Außerdem wurden sie im Nachfragebogen erneut über ihre Einstellung zu computervermitteltem Lernen und Kommunikation befragt.

 

Abhängig von den technischen Möglichkeiten der einzelnen Teilprojekte wurden neben diesen subjektiven Daten aus den Fragebögen auch Server-Protokolldaten ausgewertet, die objektive Informationen über die Nutzung der Online-Materialien durch die  Studierenden geben konnten: z.B. wie oft und wie lange sich die Teilnehmer mit diesen Materialien beschäftigt hatten oder welche Materialien sie am häufigsten und intensivsten bearbeitet hatten.

 

Ergebnisse bzgl. des Ergänzungsszenarios

Aus 7 Teilprojekten, in denen die multimedialen Lernmaterialien als Ergänzung einer Präsenzveranstaltung angeboten wurden (Ergänzungsszenario), liegen von 244 Teilnehmern komplette Datensätze (Vor- und Nachfragebogendaten) vor.

 

Diese zeigen eine suboptimale Nutzung der Online-Materialien durch die Studierenden: diese äußerten, sich im Durchschnitt nur 17% ihrer gesamten Lernzeit mit den multimedialen Lernmaterialien beschäftigt zu haben, 44% dieser Materialien bearbeitet zu haben, und die angebotenen interaktiven Möglichkeiten (z.B. interaktive Grafiken, Simulationen) relativ selten benutzt zu haben (Mittelwert: 2,83 auf einer Skala von 1-nie bis 7-sehr häufig). Um den möglichen Einfluss individueller Lernervoraussetzungen auf die Nutzung dieser Materialien zu untersuchen, wurden schrittweise Regressionsanalysen durchgeführt. Dabei wurden 1) die Motivation zum Lernen mit Medien, das Alter der Studierenden und ihre Voreinstellung zum computervermittelten Lernen (CVL) als Prädiktoren für die Lernzeit mit den Online-Materialien [R = 0,30, R2 = 0,09, F(3,207) = 6,62, p < 0,001], 2) die Computererfahrung der Studierenden sowie ihre Einstellung zum CVL im Vergleich zu traditionellen Lernformen als Prädiktoren für den Anteil der bearbeiteten Online-Materialien [R = 0,32, R2 = 0,10, F(2,205) = 11,71, p < 0,001], und 3) ihre Computererfahrung, ihre Motivation zum Lernen mit Medien und die Anzahl der Semester ihrer bisherigen Universitätsausbildung als Prädiktoren für die Häufigkeit der Nutzung der interaktiven Komponenten [R = 0,44, R2 = 0,19, F(3,221) = 17,53, p < 0,001] ermittelt.

 

Die Bewertung unterschiedlicher Aspekte der multimedialen Lehrveranstaltungen durch die  Teilnehmer war insgesamt mittelmäßig, mit Durchschnittswerten um den Mittelpunkt einer Skala von 1-sehr negativ bis 7-sehr positiv. Schrittweise Regressionsanalysen wurden ebenfalls durchgeführt, um den Einfluss der individuellen Lernervoraussetzungen sowie der Nutzungsvariablen auf die Bewertung dieser Aspekte zu erforschen. Dabei wurden folgende Variablen als Prädiktoren der Bewertung seitens der Studierenden gefunden: 1) ihre Motivation zum Lernen mit Medien und die pro Tag am Computer verbrachte Zeit als Prädiktoren für ihre Bewertung der Gestaltung der Materialien [R = 0,30, R2 = 0,09, F(2,197) = 9,61, p < 0,001], 2) die Lernzeit mit den Online-Materialien und ihre Voreinstellung zum CVL als Prädiktoren für ihre Bewertung der Inhaltsaufbereitung [R = 0,36, R2 = 0,13, F(2,198) = 14,83, p < 0,001], 3) die Lernzeit mit den Online-Materialien, die Häufigkeit ihrer Nutzung von interaktiven Komponenten und ihr Vorwissen zum Lerninhalt als Prädiktoren für ihre Bewertung der instruktionalen Maßnahmen [R = 0,31, R2 = 0,10, F(3,197) = 7,10, p < 0,001], 4) die Lernzeit mit den Online-Materialien, die intrinsische Motivation der Studierenden und den Anteil der bearbeiteten Online-Materialien als Prädiktoren für ihre Bewertung der gestellten Lernaufgaben [R = 0,39, R2 = 0,15, F(3,168) = 10,15, p < 0,001], 5) ihr Vorwissen zum Inhalt und ihre Einstellung zum CVL als Prädiktoren für ihre Bewertung der erhaltenen Betreuung [R = 0,35, R2 = 0,12, F(2,197) = 13,60, p < 0,001], 6) ihre Einstellung zum CVL vor ihrer Teilnahme an der Lehrveranstaltung, die Häufigkeit ihrer Nutzung von interaktiven Komponenten sowie die pro Tag am Computer verbrachte Zeit als Prädiktoren für ihre Einstellung zum CVL am Ende der Veranstaltung [R = 0,60, R2 = 0,36, F(3,195) = 35,93, p < 0,001], 7) ihre Einstellung zum CVL im Vergleich zum traditionellen Lernen am Anfang der Lehrveranstaltung, die Häufigkeit ihrer Nutzung von interaktiven Komponenten sowie die Anzahl der Semester ihrer bisherigen Universitätsausbildung als Prädiktoren für ihre Einstellung zum CVL vs. traditionellem Lernen am Ende der Veranstaltung [R = 0,46, R2 = 0,21, F(3,196) = 17,66, p < 0,001].

 

Da in den unterschiedlichen Lehrveranstaltungen nicht dieselben Server-Protokolle erhoben werden konnten, waren die Daten zur Nutzung der Online-Materialien auf der Basis der objektiven Log-Daten nicht über alle Projekte vergleichbar. Im folgenden soll deshalb eine typische Lehrveranstaltung für das Ergänzungsszenario als Fallbeispiel dienen. Dabei stand eine Vorlesung im Zentrum der Lehrveranstaltung, zu der die Studierenden begleitend die Möglichkeit hatten, ein Online-Lehrbuch zu nutzen. Dieses Online-Lehrbuch enthielt neben dem erklärenden Text mehrere kleine Applets, mit denen die Studierenden interaktiv Übungen durchführen konnten. Die Analyse der Server-Protokolle ergab, dass alle 21 Teilnehmer im Laufe des Semesters 3235 Zugriffe auf das Online-Lehrbuch tätigten. Allerdings zeigten sich extrem große Unterschiede zwischen den Teilnehmern. Allein auf einen Teilnehmer fielen ca. 600, d.h. 19% aller Zugriffe. Zwei weitere Teilnehmer tätigten jeweils ca. 300 Zugriffe, drei Teilnehmer zwischen 100 und 200 Zugriffe und 14 Teilnehmer weniger als 100 Zugriffe im gesamten Semester. Insgesamt fielen 50% aller Zugriffe auf die ersten 40 Seiten des Lehrbuchs, das insgesamt 257 Seiten umfasste. Auf einer Seite, die vom Umfang her etwa einer knappen Buchseite eines Lehrbuchs entspricht, verblieben die Studierenden im Durchschnitt 88 Sekunden, wobei auch hier starke Unterschiede zwischen den Teilnehmern bestanden (zwischen 10 Sekunden und 140 Sekunden). Bei den Seiten des Lehrbuchs mit interaktiven Applets verweilten die Studierenden durchschnittlich ca. 3 Minuten. Auf das ganze Semester bezogen bedeutet dies, dass sich die Studierenden durchschnittlich 3,7 Stunden mit dem Online-Lehrbuch beschäftigten. Auch hier bestand eine große Varianz: Eine Person war ca. 25 Stunden im Semester eingeloggt, 2 Personen zwischen 5 und 10 Stunden und die anderen 20 Personen weniger als 2 Stunden. Diese Daten aus der Analyse von den Log-Files einer Vorlesung mit begleitenden Online-Materialien stimmen mit den oben genannten Daten aus den Fragebögen bzgl. der suboptimalen Nutzung dieser Art Materialien in sieben anderen Teilprojekten überein.

 

Ergebnisse bzgl. des Workshopszenarios

Aus 2 Teilprojekten, in denen das Workshopszenario durchgeführt wurde, liegen von 81 Teilnehmern komplette Datensätze (Vor- und Nachfragebogendaten) vor.

 

Auch in diesem Szenario gaben die Studierenden an, im Durchschnitt 17% ihrer Lernzeit mit dem Lernen des Online-Materials zugebracht zu haben. Dabei bearbeiteten sie durchschnittlich 75% der Materialien, also deutlich mehr als im Ergänzungsszenario. Im Workshopszenario können Merkmale des Lernprozesses (Anteil der bearbeiteten Online-Materialien, Lernzeit mit Online-Materialien) nicht von den Lernervoraussetzungen prädiziert werden. Allein die Bewertung des Lerninhalts und der Online-Materialien werden zu 16% bzw. 9% durch die intrinsische Motivation zu Beginn der Lehrveranstaltung bestimmt (r = 0,42, p < 0.001; r = 0,35, p < 0.01). Computererfahrung, die Einstellung zum computerbasierten Lernen vor Besuch der Lehrveranstaltung und die Motivation, mit Medien zu Lernen, haben keinen nennenswerten Einfluss auf die Nutzung der Online-Materialien und die Bewertung unterschiedlicher Elemente der Lehrveranstaltung.

 

Die Protokolldaten, die in Workshopszenarien aufgezeichnet werden konnten, waren je nach verwendeter Software unterschiedlich. Den folgenden Daten liegt ein Seminar zugrunde, das mit BSCW, einer von der GMD entwickelten Software (http://bscw.gmd.de/), durchgeführt wurde. Aufgezeichnet wurde hier, welche Person welche Dateien wann erstellt hatte und welche Dateien wann von wem gelesen wurden. So konnte bei der Evaluation zwischen aktiver und passiver Partizipation (Dateien schreiben vs. Dateien lesen) unterschieden werden. Das Seminar des SS 1999 erstreckte sich über 80 Tage. Im ersten Drittel des Seminars sollten die Studiereden selbständig Aufgaben bearbeiten und im BSCW ablegen. Im zweiten Drittel sollten sie darauf aufbauend kooperativ Texte erstellen, die im dritten Drittel gemeinsam diskutiert wurden. Die Log-Files ergaben, dass sich die Studierenden im Durchschnitt alle 3,22 Tage eingeloggt hatten.

 

Zur aktiven Partizipation: Insgesamt wurden im Laufe des Seminars 142 Objekte (d.h. Textdateien) erstellt. Diese verteilten sich auf Studierenden und Dozenten wie folgt: Die 11 Teilnehmer erstellten zusammen ca. zwei Drittel aller Objekte (2 Teilnehmer erstellten jeweils 2 Objekte, 2 jeweils 5 und die anderen 7 zwischen 9 und 14 Objekte), die beiden Dozenten das andere Drittel.

 

Zur passiven Partizipation: Jeder Studierenden griff im Laufe des Semesters auf durchschnittlich 88 der 142 Beiträge zu (ein Student öffnete nur 37 Beiträge, ein weiterer 53, die anderen 9 öffneten zwischen 78 und 129 Beiträge). Ein weiteres Maß zur passiven Partizipation stellt die Lesesättigung dar. Sie gibt an, nach welcher Zeit ein erstellter Beitrag von 25%, 50% oder 75% aller Teilnehmer gelesen wurde. Die Analyse der Log-Files zeigte, dass ein Beitrag im Durchschnitt bereits nach einem Tag von 25% aller Teilnehmer gelesen wurde und nach 5 Tagen von der Hälfte aller Teilnehmer. Bei Beiträgen, die von mehr als 75% aller Personen gelesen wurden, wurde diese Schwelle nach ca. 9 Tagen überschritten. Dabei ließ sich kein Unterschied in der Lesesättigung in Abhängigkeit davon feststellen, ob der Beitrag von einem Studierenden oder einem Dozenten erstellt worden war.

 

 

Diskussion der Befunde

Die Ergebnisse unserer Evaluationsstudie zeigten, dass die Nutzung und die Bewertung von Online-Materialien seitens der Studierenden im Ergänzungsszenario nicht nur durch die dem spezifischen Lernszenario zugrundeliegende Medienkonzeption bedingt werden, sondern auch durch individuelle Lernvoraussetzungen der Studierenden (vgl. Hasebrook, 1995; Hiltz, 1994; Kozma, 1991, u.a.).

 

In Ergänzungsszenarien wurden die Online-Materialien und ihre Interaktionsmöglichkeiten suboptimal genutzt. Sofern diese Materialien didaktisch nicht eng an die Lehrveranstaltung angebunden sind, und die Studierenden auf diese Weise (z.B. im Rahmen spezifischer Aufgaben) aufgefordert werden, sie zu nutzen, verwenden die Studierenden diese kaum (vgl. Hiltz, 1997). In der Nutzung der Online-Materialien gab es große Unterschiede zwischen den Teilnehmern. Diese sind u.a. durch unterschiedliche individuelle Lernervoraussetzungen zu erklären, wie ihre Motivation zum Lernen mit Medien, ihre Computererfahrung und ihre Einstellung zum CVL. Auch ihre Bewertung der multimedial aufbereiteten Lehrveranstaltungen wurde durch individuelle Faktoren (spezifische Lernervoraussetzungen und Ausmaß ihrer Nutzung der Online-Materialien) bedingt. Dies deutet darauf hin, dass bei ungünstigen individuellen Lernvoraussetzungen der Teilnehmer (z.B. geringer Motivation zum Lernen mit Medien, geringer Computererfahrung, negativer Einstellung zum CVL) spezifische instruktionale Maßnahmen ergriffen werden sollten, um diese negativen Voraussetzungen zu kompensieren.

 

Ein anderes Nutzungsbild hat das Workshopszenario aufgewiesen, bei dem Studierende nicht nur auf entwickelte Materialien zurückgreifen können, sondern bei dem die kollaborative Erstellung der Studienmaterialien ein wichtiger Bestandteil der Lehrveranstaltung ist. Durch die enge instruktionale Einbindung der Materialien, deren Bearbeitung verpflichtend ist, kommen hier die Lernvoraussetzungen der Studierenden weniger stark zum Tragen. In diesem Szenario partizipierten fast alle Teilnehmer sowohl aktiv (durch die Erstellung von Textdateien oder Diskussionsbeiträgen) als auch passiv (durch das Lesen der von anderen Studierenden erstellten Beiträge). Zwar bestehen auch hier in der Nutzung der Materialien Unterschiede zwischen Studierenden, dennoch ist die Aktivität der Studierenden wesentlich homogener über die Gesamtgruppe verteilt und der Gesamtanteil der Aktivität der Studierenden liegt deutlich höher.

 

Literatur

Döring, N. (1997). Das WWW im Unterricht. Organisatorischer Rahmen, didaktische Grundlagen und praktische Beispiele. In D. Janetzko, B. Batinic, D. Schoder, M. Mattingley-Scott & G. Strube (Hrsg.). CAW-97. Beiträge zum Workshop „Cognition and Web“. IIG-Berichte 1/97. Freiburg. Elektronische Version.

 

Hasebrook, J.P. (1995). Lernen mit Multimedia. Zeitschrift für Pädagogische Psychologie, 9 (2), 95-103.

 

Hesse, F.W. & Schwan, S. (im Druck). Internet-Based Teleteaching. In W. Krank, J.F. Leonhard, H.W. Ludwig & E. Straßner (Eds.), Media: Technology, History, Communication, Aesthetics. An International Handbook of International Research. Handbook of Linguistics and Communication Science. Berlin: de Gruyter.

 

Hiltz, S.R. (1994). The virtual classroom. Learning without limits via computer networks. Norwood, NJ: Ablex Publishing Corporation.

 

Hiltz, S.R. (1997). Impacts of college-level courses via Asynchronous Learning Networks: Some Preliminary Results. Journal of Asynchronous Learning Networks, 1 (2). Electronic version.

 

Kozma, R.B. (1991). Learning with Media. Review of Educational Research, 61 (2), 179-211.

 

Lawless, K.A. & Brown, S.W. (1997). Multimedia learning environments: Issues of learner control and navigation. Instructional Science, 25, 117-131.

 

Marchionini, G. (1990). Evaluating Hypermedia-Based Learning. In D.H. Jonassen & H. Mandl (Eds.), Designing Hypermedia for Learning. Berlin, Heidelberg: Springer Verlag.

 

Rieber, L.P. (1991). Animation, Incidental Learning, and Continuing Motivation. Journal of Educational Psychology, 83 (3), 318-328.

 

Tissue, B.M., Earp, R.L. & Yip, C.-W. (1996). Design and Student Use of World Wide Web-Based Prelab Exercises. The Chemical Educator, 1 (1). Electronic version.

 

Weidenmann, B. (1995). Multicodierung und Multimodalität im Lernprozess. In L.J. Issing & P. Klimsa (Hrsg.) Information und Lernen mit Multimedia [S. 65-84]. Weinheim: Psychologie Verlags Union.

 


Deutschmann, Marc ; Institution: FB1 – Soziologie , Gerhard-Mercator-Universität Duisburg
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Nonresponse-Probleme bei der Rekrutierung von Online-Samples durch CATI-Screening."


Diemers, Daniel ; Institution: Institute for Sociology, University of St. Gallen
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"VISAM. A Methodology for an internet-based early warning system."


Duda, Sabrina ; Schießl, Michael ; Hess, Jan Michael; Institution: eye square, Berlin
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"WAP – Ready or Not?"


Eichstaedt, Jan ; Institution: Universität der Bundeswehr, Hamburg
Article (version: 25/06/2002 - 07:47, size: 20582)
"Technique and application of measuring reaction time using Java-Applets: How to improve online marketing research by social-cognition-based measures in Web experiments."
German:

Wouldn’t it be great? Early on Friday morning, you, a researcher, interested in reaction times, have a bright idea for a very telling experiment on latencies. As the idea might really be insightful, you want to know the outcome immediately. So you modify a JAVAapplet of the experiment's prior version to incorporate your new idea. It only takes you another half an hour to write down the short instruction in HTML and add an applet tag. Then you switch back to very old and puzzling data on verbal reports. After a nice day with qualitative data, your quantitative collection of the latencies is complete. The deviations look good. The differences in average latencies fit your hypotheses and the effect is huge and, of course, highly significant. Have a nice weekend!

Unfortunately so far, this is only a fairy tale, because of the inaccuracy of latencies measured with applets. It is much more probable that the latencies actually measured by the applet are so inaccurate that everything looks like a mess.

There are quite a few studies using Internet technique on measures other than latencies (e.g. Janetzko, Hildebrandt, & Meyer, 1999; Klauer, Musch, & Naumer, 2000; Krantz, Ballard, & Scher, 1997; Reips, 1996; 2000; Welch & Krantz, 1996). To measure latencies, JAVAapplets are a step in the right direction, because they run on client side and therefore no net lag can obscure latencies. At first glance this enables us to measure social-cognition-based measures like implicit product attitudes by the implicit association test (IAT; Greenwald, McGhee, & Schwartz, 1998), which is based on latency measurement. The IAT would be of great virtue for online marketing research.

Participants of an IAT categorize stimuli of two different categories or domains, each in two subcategories, using only two response keys. Because one of the categories consists of positive or negative adjectives and the other consists of the attitude objects, subcategory memberships can correspond to an evaluative dimension. If they are compatible, categorizing will be fast. However, if they are incompatible, categorizing will be slow and the latency difference between compatible and incompatible condition will yield a compatibility effect. This compatibility effect is used to indirectly measure the participant's attitude. Some researchers hope that implicit attitudes measured by the IAT will have higher prognostic validity than classical explicit attitude measures in the field of marketing research (Plessner, Richter, & Wänke, 2000; Brunel, Collins, Greenwald, and Tietje, 1999; Maison, Greenwald, & Bruin, in press). In the domains of prejudice (Greenwald, McGhee, & Schwartz, 1998), self-esteem (Greewald & Farnham, 2000) or gender stereotypes (Nosek, Banaij, & Greenwald, 2000) the IAT has yielded promising results. Kim and Greenwald (1998) as well as Banse, Seise, and Zerbes (2001) provide evidence that participants of the IAT are not able to intentionally fake the measure. Thus, measuring consumer attitudes by the IAT would reveal the real attitude, even if the consumer couldn't verbally report on it or refused to do so. However, in most of the cited studies, strong valences of the attitude objects have been involved. Consumer attitudes may be much weaker and therefore the compatibility effect may be much smaller, too. So the inaccuracy of latencies measured by JAVAapplets may hinder the realization of this compelling chance for marketing research in the Internet.

Chiefly, the inaccurate-timing problem lies in the ability of modern operating systems to do multi tasking. It might be possible that an implementation, which is accurate under normal conditions, becomes inaccurate when, for example, the mail client (running in addition to the web-browser and the virtual machine) begins to download an attachment. Or the browser, while displaying the experiment-program, may simultaneously request another page. The processor may become overloaded, if that second page contains elements which take up a lot of resources, like an animated GIF, another JAVAapplet etc. Since such activity cannot be controlled, applets which implement experiments on the Internet must be able to prevent the impairment of the measures which is provoked by such multi tasking.

One way is to check whether the client system's performance is high enough. After successfully passing this test, latencies are recorded without further checking. Hecht, Oesker, Kaiser, Civelek, and Stecker (1999) have used this approach, although new sources of interference may arise later in the procedure. An ongoing check is desirable, but such checks consume valuable CPU-time and therefore may interfere with time-critical processes. However, Janetzko, Hildebrandt, and Meyer (1999; Hildebrandt, Meyer, & Janetzko, 1998) tested each measurement, even at later stages of the experiment.

The inaccurate-timing filter identifies impaired measurements by testing whether the virtual machine makes false measurements of a sleep interval of, let's say, 50 ms. In order to initiate the sleep interval, the sleep(d) method is issued on the control thread, which suspends it for the specified duration d. Consequently, it takes up virtually no processing power. Nevertheless, the virtual machine measures, by a specialized method, whether the duration d is exceeded. Additionally, the filter records start time and end time of the sleep interval by another method. If everything functions well, end time minus start time has to be 50 ms. If something interferes, one of the two software clocks ought to be more affected than the other. This in turn leads to inconsistencies in the measurement of the sleep interval, which the filter detects. The control thread runs in parallel to the normal business of recording the latencies and testing whether the latency measurement is correct. Compared to Janetzko's et al. parallel evaluation of the system's capacity, the filter tests the system's ability to measure time intervals directly, rather than drawing on the system's global performance. So only the measurement of the sleep interval is iterated again and again until the latency is recorded. As the control thread measures nothing other than sleep intervals, it is designed to take up very little processing power, in order to avoid interference with the latencies' measurement. Measurements of the sleep interval that the control thread identifies as false are ruled out, thus preventing corruption of the reaction time’s statistics. However, the filter is not perfect and can never correct a false measurement.

The implemented applet runs on all computer systems with full support of JDK 1.1 (Sun Microsystems, 1997). No additional permission by the client is required. To summarize, the approach is to give the virtual machine a chance to yield false time measurements by running two different software clocks at the same time.

The inaccurate-timing filter was evaluated in three studies (Eichstaedt, in press) using 11 different client systems. The keystroke repetition rate was used as an external input of latencies at a reliable and known rate. The first study showed a much higher precision of native programs on computers in the laboratory compared to JAVAapplet-based measurement, even without any impairment by multi tasking. However, when using the inaccurate-timing filter, standard deviation of the latencies became substantially reduced compared to JAVAapplets without the filter. Nevertheless, native programs remained much more reliable than JAVAapplets, even when equipped with the filter. Thus, when possible, the laboratory is the better choice. But what, if there is no way round the Internet?

The second study investigated what could happen in the worst case. The applet was running while calling additional web pages or running further applications in parallel. Errors in measuring reaction time were very much increased when the computer system ran additional processes. However, the filter diminished the standard deviation of the reaction time drastically by ruling out false measurements in all but one computer system.

In order to test whether the filter would help to find differences in arithmetic means of latencies which would otherwise be missed, the third study compared different keystroke repetition rates. Without filter, the different keystroke repetition rates were more difficult to identify than with filter. The decline in standard deviation showed up again, when using the filter compared to not using it. On the other hand, this had a price, as the number of accepted measurements diminished greatly.

Thus, the inaccurate-timing filter might enable applets to be used as the basis for latency measurement experiments with an accuracy previously not met by applets. On the other hand, differences in keystroke repetitions do not provide a good example with which real effects in the cognitive domain can be compared. This is due to the minimal variance of the keystroke differences' underlying process, which is of electronic rather than psychological origin. Therefore using a more relevant effect is desirable. The best candidate may be the compatibility effect obtained by the IAT, because it would demonstrate the inaccurate-timing filter's performance in a straight experiment which, nevertheless, allows us to use the filter in the field of consumer attitudes.

Experiment 1

Greenwald's et al. (1998) first experiment was repeated. So the question remains the same. Would the IAT validely reveal attitudes for objects of intersubjectively obvious valences? Compared to Greenwald's et al procedure, the extension is to provide two classes of attitude objects marking two grades of valences. So the valence extremity was varied as one factor in the design to yield attitudes of two extremities, which were supposed to be reflected in the IAT-measure. If this is the result, it provides evidence that the IAT may be capable of reflecting attitude extremity (Abelson, 1995; Downing, Judd, & Brauer, 1992; Tesser & Mendolia, 1995). More important for the technical purpose of this paper, the lower attitude extremity of the two should show its compatibility effect only with the help of the inaccurate-timing filter. Therefore corresponding planned comparisons were calculated.

Procedure. A Web-experiment was conducted by means of a JAVAapplet which applied the inaccurate-timing filter. The client computers were brought in the study by the participants. Also the potential interference of additional programs running in multi tasking was not controllable. In two successive IATs the participants had to distinguish pictures of spiders from pictures of butterflies in the category insects and smiling faces from angry faces in the category faces. A fixed RSI of 1000 ms was used. In the first step of the IAT-procedure each participant had to categorize the attitude objects into the two subcategories. This was done in two blocks, each containing 50 trials (category decisions). In the second step participants had to decide whether an adjective was positive or negative. In the third block both tasks, categorization and adjective-decision, followed in alternating succession in four blocks. The fourth step reversed the association of the subcategories to the answering keys in one block. The fifth step mirrored the third and used the key association of the fourth step for the categorization of the attitude objects. Then a second IAT-procedure followed, using the second category which omitted the obsolete second step (see Greenwald et al., 1998, Exp. 1, for details). 20 students of the University of the Federal Armed Forces Hamburg participated and got credit points for it.

Results. For sake of brevity, only the compatibility and the category effects are reported. Both main effects are highly significant with means in the predicted directions (fig. 1), supporting the hypotheses.


Figure 1: Compatibility and category effect in Experiment 1.

However, only the planned comparison within the more extreme faces-category is significant. The less extreme insect category did not yield a significant compatibility effect (F(1,19)=4.279, p < .10). This changed when the inaccurate-timing filter was applied which allowed for significance (see fig. 1) also with insects as attitude objects. The difference in this category is only 40 ms., but the inaccurate-timing filter reveals this difference to be small but reliable.

Experiment 2

Are product attitudes accessible with the same validity as those obvious object attitudes of Experiment 1? One product was chosen. In the standard version the IAT can only measure the attitude difference of two subcategories in comparison. This is a disadvantage, since explicit measures all are capable of measuring absolute attitudes of single objects.

Procedure. In order to measure the product attitude of only one product pictures of the product were taken before and after use of this product. Specifically, a box of After Eight chocolates was photographed in an enticing manner with all those fine chocolate mints included and displayed (new After Eight) and, as a counter part, the leftovers of the packaging with not quite so enticing chocolate mint fragments were pictured (used After Eight). Obviously, attitudes should be more positive for new After Eight than for used After Eight. The material was run in an IAT with 10 students participating.

Results. There was a main effect compatibility (F(1,9)=12.376; p< .01) with 655 ms in the compatible condition and 755 ms in the incompatible condition, substantiating that Greenwald's et al. results are replicable with a product attitude, too, thereby revealing an attitude for a single attitude object. Without the inaccurate-timing filter the compatibility effect missed the standard significance criterion (F(1,9)= 4.405575; p= .065).

Discussion

As regards technique, the inaccurate-timing filter did its job well enough to find existing effects which otherwise would have been missed. This enables us to apply the IAT in the field of online marketing research. As regards content, the results of Experiment 1 provide evidence that the IAT may be capable of depicting attitude extremity.

Experiment 2's results show that product attitudes for a single product also are accessible. It would be interesting to compare the new/used-approach taken here with the go-nogo method of (Nosek & Banaji, submitted), which also allows us to measure attitudes for single objects. Measuring absolute attitudes seems to be inevitable in the realm of marketing research, because comparison of more than two products is necessary. So we have a context-free measurement of product attitudes.

While the inaccurate-timing filter was applied to the IAT-procedure, it can also be useful in all application where latency effects are not expected to be huge but where, at the same time, the internet must be used.

References

Abelson, R.P. (1995). Attitude extremity. In: R.E. Petty & J.A. Krosnick (Eds). Attitude strength: Antecedents and consequences. Ohio State University series on attitudes and persuasion, Vol. 4. (pp. 25-41). Hillsdale, NJ: Lawrence Erlbaum Associates.

Banse, R., Seise, J., & Zerbes, N. (2001). Implicit attitudes towards homosexuality: Reliability, validity, and controllability of the IAT. Zeitschrift für Experimentelle Psychologie, 48, 145-160.

Brunel, F.F., Collins, C.M., Greenwald, A.G. & Tietje, B.C. (1999, October). Making the private public, accessing the inaccessible: Marketing applications of the Implicit Association Test. Paper presented at meetings of the Association for Consumer Research, Columbus, Ohio.

Downing, J.W., Judd, C.M., & Brauer, M. (1992). Effects of repeated expressions on attitude extremity. Journal of Personality and Social Psychology, 63, 17-29.

Eichstaedt, J. (in press). An inaccurate-timing filter for reaction-time measurement by JAVA-applets implementing Internet-based experiments. Behavior Research Methods, Instruments, & Computers, 33.

Greenwald, A.G., McGhee, D.E. & Schwartz, J.L.K. (1998). Measuring individual differences in implicit Cognition: The implicit association test. Journal of Personality and Social Psychology, 74, 1464-1480.

Greenwald, A.G. & Farmham, S.D. (2000). Using the Implicit Association Test to measure self-esteem and self-concept. Journal of Personality and Social Psychology, 79, 1002-1038.

Hecht, H., Oesker, M., Kaiser, A., Civilek, H., & Stecker, T. (1999). A perception experiment with time-critical graphics animation on the word-wide web. Behavior Research Methods, Instruments, & Computers, 31, 439-445.

Hildebrandt, M., Meyer, H. & Janetzko, D. (1998, October). JAVA-basierte Versuchsdurchführung: Potentiale und Probleme am Beispiel von Reaktionszeitexperimenten. [JAVA-based conducting of experiments: Potentials and problems shown by the example of reaction time experiments]. Paper read at German Online Research (28.-29. 10.), Mannheim.

Janetzko, D., Hildebrandt, M., & Meyer, H. (1999, March). JAVA-basierte Versuchsdurchführung im WWW: Potentiale und Probleme am Beispiel von Reaktionszeiten. [JAVA-based experimenting in the WWW: Potentials and problems shown by the example of reaction times]. Abstract in: E. Schröger, A. Mecklinger, & A. Widmann (Eds.). Experimentelle Psychologie: 41. Tagung experimentell arbeitender Psychologen. Lengerich: Pabst.

Kim, D.-Y. & Greenwald, A.G. (1998, May). Voluntary controllability of implicit cognition: can implicit attitudes be faked? Paper presented at meetings of the Midwestern Psychological Association, Chicago.

Klauer, K.C., Musch, J. & Naumer, B. (2000). On belief bias in syllogistic reasoning. Psychological Review, 107, 852-884.

Krantz, J.H., Ballard, J., & Scher, J. (1997). Comparing the results of laboratory and Word-Wide Web samples on the determinants of female attractiveness. Behavior Research Methods, Instruments, & Computers, 29, 264-269.

Maison, D., Geenwald, A.G., & Bruin, R. (in press). The Implicit Association Test as a measure of implicit consumer attitudes. Polish Psychological Bulletin.

Plessner, H., Richter, L. & Wänke, M. (2000, September). Implizite Einstellungen als Prädiktoren von Konsumverhalten: Anwendungen des Implicit Association Test. Vortrag auf dem 41. Kongreß der Deutschen Gesellschaft für Psychologie in Jena.

Nosek, B. & Banaji, M.R. (submitted). The go/no-go association task. Manuscript submitted for publication. Yale University, New Haven, CT.

Nosek, B., Banaji, M.R., & Greenwald, A.G. (2000). Math = Male, Me = Female, therefore Math ¹ Me. Manuscript submitted for publication. Yale University, New Haven, CT.

Reips, U.-D. (1996, October). Experimenting in the World-Wide Web. Paper presented at the 1996 Society for Computers in Psychology conference, Chicago.

Reips, U.-D. (2000). The Web Experiment Method: Advantages, Disadvantages, and Solutions. In M. H. Birnbaum (Ed.), Psychological Experiments on the Internet (pp. 89-114). San Diego, CA: Academic Press.

Sun Microsystems (1997). JAVA development kit version 1.1. Available: http://java.sun.com/products/jdk/1.1/index.html.

Tesser, A. M. L. & Mendolia, M. (1995). The impact of thought on attitude extremity and attitude-behavior consistency. In: R.E. Petty & J.A. Krosnick (Eds). Attitude strength: Antecedents and consequences. Ohio State University series on attitudes and persuasion, Vol. 4. (pp. 25-41). Hillsdale, NJ: Lawrence Erlbaum Associates.

Welch, N. & Krantz, J.H. (1996). The World-Wide Web as a medium for psychoacoustical demonstrations and experiments: Experience and results. Behavior Research Methods, Instruments, & Computers, 28, 192-196.


Frick, Andrea ; Krist, Horst ; Huber, Susanne; Reips, Ulf-Dietrich ; Institution: Psychologisches Institut, Universität Zürich
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Intuitives Wissen über das Pendelgesetz: ein Zeitschätzungsexperiment in Labor und Web."


Gadeib, Andera ; Institution: Dialego Online Market Research GmbH, Aachen
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Möglichkeiten und Grenzen der Online-Forschung mit Virtuellen Realitäten – dargestellt am Conjoint Measurement im Produkttest."


Geißler, Holger ; Müller-Peters, Horst Institution: psychonomics AG, Köln
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Dimensionen der Wirkung von Websites – oder warum Usability allein zu kurz greift."


Göritz, Anja S. ; Institution: Lehrstuhl für Wirtschafts- und Sozialpsychologie, Friedrich-Alexander-Universität Erlangen-Nürnberg
Article (version: 25/06/2002 - 07:47, size: 20151)
"Gratifikation im Online Panel: Ein Experiment zu Art, Höhe und Stückelung eingesetzter Incentives."
German: Als Wirkmechanismen, die das Teilnahmeverhalten an Untersuchungen in Abhängigkeit der Gratifikation theoretisch beschreiben, erklären und vorhersagen könnten, bieten sich zwei Ansätze an. Der erste Zugang erschließt sich durch ein Bündel ökonomischer Theorien, die hier zusammengefasst als Nutzwerttheorien bezeichnet werden sollen. Diese Theorien postulieren das utilitaristische Bestreben der Teilnehmer, ihren Gewinn zu maximieren. Ein Proband willigt eher zur Teilnahme ein, wenn diese einen Gewinn verspricht. Dabei werden Kosten (Zeit, Anstrengung, Gebühren) gegen Nutzen (ökonomisch, sozial, etc.) gerechnet. Ist einmal die Entscheidung zur Teilnahme gefallen, strebt der Teilnehmer auch während der Teilnahme eine Gewinnmaximierung an. Laut diesen Theorien leiten sich als Erwartungen für die hiesige Untersuchung ab: Erstens, je höher das Incentive desto wahrscheinlicher ist eine Teilnahme. Die Wahrscheinlichkeit der Teilnahme sollte sich im Anteil der gültige Teilnahmen, der Abbrüche und Verweigerungen niederschlagen. Zweitens, die Sorgfalt der Bearbeitung des Fragebogens ist unabhängig von der Höhe des Incentives, was sich am Anteil der Unterbrechungen und vor allem der Ausfüllzeit zeigen sollte. Bei einer reicheren Belohnung mehr Zeit zu investieren, widerspräche dem Prinzip der Gewinnmaximierung, denn unabhängig von der Bearbeitungszeit oder einer Unterbrechung bekommt die Versuchsperson ihre zugesicherte Gratifikation.
 
Der zweite Ansatzpunkt zur Erklärung des Auswirkungen von Gratifikationen auf das Teilnahmeverhalten ist die "Social Exchange Theory" (Blau, 1964; Thibaut & Kelley, 1959). Im Sinne dieser Konzeption ist die Teilnahme an einer Untersuchung aus Perspektive des Probanden als sozialer Austauschprozess anzusehen. Potentielle Teilnehmer wägen zunächst wie bei den Nutzwerttheorien Kosten und Nutzen einer Untersuchung ab, bevor sie sich für oder gegen eine Teilnahme entscheiden. Entschließt sich ein Proband zur Teilnahme, so geht er einen sozialen Vertrag ein und bemüht sich, die Vertragsbedingungen zu erfüllen. Abweichend vom Prinzip der unmittelbaren Gewinnmaximierung spielen beim sozialen Austausch auch Fairness und das Bestreben, dass beide Vertragsparteien mit dem "Handel" zufrieden sind, eine Rolle. Bei einem stattlicherem Incentive besteht demzufolge auch die innere Pflicht zu einer größeren Gegenleistung, die sich auch auf die Sorgfalt auswirkt. Laut der Theorie des Sozialen Austauschs leiten sich als Erwartungen für die hiesige Untersuchung folglich ab: Erstens, je höher das Incentive desto wahrscheinlicher ist eine Teilnahme und zweitens, die Sorgfalt der Bearbeitung des Fragebogens steigt mit der Höhe des Incentives.
 

 
Methode
 
Es handelte sich um ein unvollständiges 3 X 4 X 2-Versuchsdesign (vgl. Tabelle 1). Die fünf abhängigen Variablen
 

Tabelle 1: Versuchsplan (N = 6155)
 

 
Ergebnisse
 
Frage 1: Wirkung der Gabe einer unterschiedlichen Anzahl von Bonuspunkten
In Abbildung 1 ist der Teilnahmestatus in Abhängigkeit von der Anzahl der vergebenen Bonuspunkte dargestellt.
 

Abbildung 1: Teilnahmestatus in Abhängigkeit von der Anzahl der Bonuspunkte
 
Der Zusammenhang zwischen dem Anteil der Abbrecher und der Anzahl der vergebenen Bonuspunkte war als einziger signifikant, rpb(1199) = -.07, p = .013, d.h. je mehr Bonuspunkte ausgeschüttet worden, desto geringer war der Anteil der Abbrecher. Die Effektstärke betrug r = .09, was einer kleinen Wirkung entspricht. Alle anderen Zusammenhänge (Anteil der gültigen Teilnahmen, der Unterbrechungen und der Verweigerungen) waren nicht signifikant. Der Zusammenhang zwischen der Ausfüllzeit und der Anzahl der vergebenen Bonuspunkte war signifikant, r(931) = .07, p = .04, d.h. je mehr Bonuspunkte ausgeschüttet worden, desto mehr Zeit nahmen sich die Probanden für die Beantwortung der Items. Im Vergleich zu einem gemeinhin als klein bezeichneten Effekt (Cohen, 1977) war die Stärke dieses Zusammenhangs jedoch noch geringer.
 
Frage 2: Wirkung unterschiedlicher Erwartungswerte der Gewinne in der Geldverlosung
In Abbildung 2 ist der Teilnahmestatus in Abhängigkeit vom Erwartungswert der Geldgewinne dargestellt.
 

Abbildung 2: Teilnahmestatus in Abhängigkeit von der Höhe der Verlosungsbeträge
 
Alle Zusammenhänge (Anteil der gültigen Teilnahmen, der Unterbrechungen, der Abbrecher, der Verweigerungen sowie die Ausfüllzeit) waren nicht signifikant.
 
Frage 3: Wirkung der unterschiedlichen Stückelung der Verlosungsbeträge
Es gab keinerlei signifikante Unterschiede (Anteil der gültigen Teilnahmen, der Unterbrechungen, der Abbrecher, der Verweigerungen sowie die Ausfüllzeit) zwischen den zusammengefassten Gruppen mit großer und denen mit kleiner Stückelung.
 
Frage 4: Wirkung der Gabe von Bonuspunkten versus Geldverlosung
Bei der Vergabe von Bonuspunkten gab es signifikant prozentual mehr gültige Datensätze als bei der Geldverlosung. Bei Bonuspunkten nahmen 77.6% bis zum Ende teil gegenüber 72.5% bei der Verlosung von Geld, Chi2(1, n = 5603) = 12.6, p < .001, r = .05. Der Anteil der Unterbrecher unterschied sich nicht signifikant, Chi2(1, n = 5603) = 2.8, p = .09. Beim Anteil der Abbrecher fand sich ein signifikanter Unterschied. Bei Bonuspunkten beendeten nur 2.4% ihre Teilnahme vorzeitig und bei der Geldverlosung 3.9%, Chi2(1, n = 5603) = 5.9, p < .015, r = .03. Bei der Vergabe von Bonuspunkten gab es signifikant weniger Verweigerer als bei der Geldverlosung. Bei Bonuspunkten reagierten 17.6% auf die Einladung nicht gegenüber 22.0% bei der Verlosung von Geld, Chi2(1, n = 5603) = 10.8, p = .001, r = .04. In Bezug auf die Ausfüllzeit unterschieden sich die zusammengefassten Bonuspunktegruppen ebenfalls nicht signifikant von den Gruppen mit Geldverlosung. Die Differenz zwischen beiden Gruppen von 18 Sekunden war zufällig, t(4124) = -1.6, p = .11.
 
Frage 5: Wirkung der Geldverlosung versus Verlosung von Sachgütern
Es gab keinerlei signifikante Gruppenunterschiede.
 

 
Diskussion
 
Auf Basis der vorgefundenen Effekte ergaben sich interessante Hinweise auf zugrundeliegende Wirkmechanismen.In den zusammengefassten Bonuspunkte-Gruppen wurden prozentual mehr gültige Datensätze, weniger Abbrecher und weniger Verweigerer als bei den zusammengefassten Geldverlosungsgruppen gezählt. Bonuspunkte scheinen also insgesamt etwas beliebter als Geldverlosungen zu sein. Zum einen könnte diese Präferenz in dem insgesamt höheren Erwartungswert der Bonuspunktebedingungen begründet sein. Aber auch andere Erklärungen kommen in Frage. So besteht vermutlich bei Bonuspunkten ein Anreiz zur Akkumulation, denn in dem untersuchten Panel kann man seine Bonuspunkte erst ab einer bestimmten angesammelten Menge gegen einen Gutschein für einen Online-Shop einlösen. Allerdings besteht für die Panelisten auch die Möglichkeit, Bonuspunkte ohne Mindesteinlösebetrag für Wohltätigkeitszwecke zu spenden. Ein weiterer möglicher Grund, könnte darin liegen, dass eine sichere Vergütung als attraktiver erlebt wird als eine Lotterie, bei der ungewiss ist, ob man überhaupt etwas für seine Anstrengung erhält. Diese Vorliebe könnte eventuell durch die sicherheitsliebendere Mentalität der Deutschen bewirkt oder verstärkt werden (Brennan, 1992). Zur Klärung dieser Frage bietet sich eine Replikation in einem multinationalen bzw. -kulturellen Online Panel an.
 
Je mehr Bonuspunkte den Probanden angeboten wurden, desto länger nahmen sie sich für das Ausfüllen des Fragebogens Zeit. Bei Bonuspunkten als Incentive steigt die Sorgfaltspflicht also mit der Gegenleistung, was auf ein Wirken der Theorie des Sozialen Austauschs zurückgeführt werden kann. Bei der Teilnahmemöglichkeit an einer Verlosung hingegen zeigte sich kein analoger Zusammenhang und dies obwohl die Erwartungswerte stärker anstiegen als bei Bonuspunkten. Dies wird so interpretiert, dass eine Teilnahme an Untersuchungen mit Geldverlosung von den Probanden nicht als sozialer Austausch verstanden wird. Die Gründe für die Disparität zwischen Bonuspunkten und Geldverlosungen scheinen plausibel. Die sichere Gabe einer verabredeten Anzahl von Bonuspunkten für die Teilnahme dürfte stärkeren Vertragscharakter haben als die spielerische Teilnahme an einer Lotterie mit unsicherem Gewinn. Alternativ könnte gemäß Wärneryd (1996) aber auch der Fall eingetreten sein, dass die Probanden die unterschiedlichen Erwartungswert-Bedingungen der Geldverlosung gar nicht unterschiedlich attraktiv wahrnahmen. Da die Gewinnhöhe konstant blieb, also je nach Stückelung eine Person immer nur 50 oder 100 DM gewinnen konnte, jedoch die Wahrscheinlichkeit eines solchen Gewinns gestaffelt war (14 mal bzw. 7 mal, 10 mal bzw. 5 mal, 6 mal bzw. 2 mal oder 2 mal bzw. 1 mal) könnte ihre Aufmerksamkeit mehr auf die Gewinnsumme als auf die Gewinnwahrscheinlichkeit gefallen sein. Um zwischen diesen beiden Deutungen unterscheiden zu können, müsste in zukünftigen Untersuchungen der Betrag variiert und dabei die Gewinnwahrscheinlichkeit konstant gelassen werden.
 
Ein weiterer gefundener Effekt war die mit steigender Anzahl der Bonuspunkte sinkende Abbrecherquote. Offensichtlich spielt bei Bonuspunkten der Erwartungswert eine Rolle, ein Ergebnis welches sowohl mit den Nutzwerttheorien als auch der Social Exchange Theorie kompatibel ist. Bei Geldverlosungen hingegen, scheint der Erwartungswert in dieser Hinsicht keine differentielle Rolle zu spielen. Auch hier ließe sich in Anlehnung an Wärneryd (1996) vermuten, dass sich die Aufmerksamkeit der Probanden in dieser Studie nur auf den Gewinnbetrag und nicht auf die Gewinnwahrscheinlichkeit gerichtet hatte.
 
Das eigentlich überraschende Hauptergebnis dieser Arbeit war jedoch die Abwesenheit von starken Effekten. Auch bei den signifikanten Zusammenhängen handelte es sich um kleine Einflüsse, die eine entsprechend geringe praktische - d.h. in diesem Fall ökonomische - Relevanz haben. Für eine Entscheidung zur Teilnahme waren also nicht die zu erlangende Belohnung, sondern andere Gründe maßgebend. Es erscheint einleuchtend, dass durch eine Teilnahme solche z.T. intrinsischen Motive wie Suche nach Spaß und Unterhaltung, Neugier oder Hilfe für die Forschung befriedigt werden können. Des weiteren sind soziale Gründe, wie ein Dazugehörigkeitsgefühl zur Gemeinschaft der Panelisten bzw. eine Identifikation mit den Prinzipien dieses Online Panels denkbar. Es stellt sich unmittelbar die Frage, ob die erzielten Ergebnisse denn spezifisch für selbstselegierte Online Panels sind, denn es ist möglich, dass sich dort verstärkt eine Klientel rekrutiert, die sich allgemein für Umfragen interessiert und eine hohe intrinsische Motivation aufweist. Bei fremdselektiv rekrutierten Panels könnte diese Tendenz weniger stark ausgeprägt sein. Aber auch dort willigen nicht alle Angesprochenen zu einer Mitarbeit im Panel ein. Es wäre interessant, eine ähnliche Untersuchung in einem für die WWW-Nutzerschaft repräsentativen Online Panel durchzuführen.
 
Laut Nutzwerttheorien und der Theorie des sozialen Austauschs entschließt sich ein Proband zur Teilnahme, falls der wahrgenommene Nutzen die wahrgenommenen Kosten überwiegt. Da eine Teilnahme an einer online Untersuchung im Vergleich zu herkömmlichen Befragungsmethoden für die Probanden in der Regel bequemer und einfacher ist, d.h. die Gesamtkosten für die Teilnahme niedrig sind, braucht deswegen auch der Nutzen, wovon die angebotene Gratifikation lediglich ein Teil ist, nur geringwertig zu sein. Eventuell wiegt die Deckung intrinsischer und anderer Motive den Teilnahmeaufwand bereits auf. Oder - den Panelisten könnte es ausreichen, wenn überhaupt eine Gratifikation angeboten wird, deren Höhe nicht ausschlaggebend ist. Pressley und Tullar (1977) sehen in dem symbolischen Akt eines Entschädigungsversuchs für die Bemühungen der Teilnehmer das Entscheidende. Dies würde bedeuten, dass der Motivationssteigerung, eine bestimmte Aufgabe in Angriff zu nehmen, eine höhere Bedeutung zugemessen wird als einer adäquaten Bezahlung (Hippler, 1988). Dieses Experiment hat gezeigt, dass die Höhe eines Incentives für das Teilnahmeverhalten im Online Panel von untergeordneter Bedeutung ist. Zu erhellen, inwiefern es sogar unwichtig ist, die Panelisten überhaupt materiell zu entschädigen, bleibt weiteren Studien überlassen, die auch eine Bedingung ohne Gratifikation erhalten1.
 
Nun handelte es sich bei diesem Experiment um eine Querschnittstudie. Es ist möglich, dass sich z.B. beim andauerndem Stattfinden von Verlosungen das Teilnahmeverhalten ändert, beispielsweise aufgrund aufkommender Langeweile, erst recht wenn eine Person bei den Verlosungen noch nie etwas gewonnen hat. Um die Frage des Zeitverlaufs des Teilnahmeverhaltens zu untersuchen sind Längsschnittstudien nötig. Allerdings zeigte sich in einem von der Autorin durchgeführten Longitudinalexperiment, bei dem die Panelisten über vier Wellen hinweg entweder Bonuspunkte erhielten oder an einer Geldverlosung teilnehmen konnten, dass sich erstens kaum Unterschiede zwischen den beiden Gratifikationsarten fanden und zweitens, dieses Muster über alle Messzeitpunkte hinweg konstant blieb (Göritz, in prep. a).
 
Bei dem hier untersuchten Panel handelte es sich um ein kommerzielles Online Panel. Es stellt sich die Frage, ob sich die hier gefundenen Ergebnisse auch auf nicht-kommerzielle Panels generalisieren lassen. Dabei bestünde die Erwartung, dass die intrinsische Motivation von Panelisten, die sich in nicht-kommerzielle Online Panels eintragen, noch höher ist, zumal diese eventuell auch denken, dass dort ohnehin "nicht viel zu holen" sei. In einem Gratifikationsexperiment mit Variation der Verlosungsausschüttung und der Stückelung der Gewinne, welches von der Autorin in einem universitären Online Panel durchgeführt wurde, ergaben sich ähnliche Wirkungen, wie die hier gefundenen. Die beiden Faktoren übten keinen Einfluss auf das Teilnahmeverhalten aus und wechselwirkten auch nicht (Göritz, in prep. b).
 
Die Qualität einer Untersuchung hängt u.a. von der Ausschöpfungsquote, aber auch von der Qualität der Antworten ab. Die Antwortqualität wiederum wird beispielsweise davon bestimmt, wie hoch der Item-Nonresponse ist, ob starke Antworttendenzen feststellbar sind und dass auf offene Fragen nicht oder nur sehr kurz geantwortet wird (Walsh, Kiesler, Sproull & Hesse, 1992). Im hiesigen Experiment wurde versucht, die Qualität der Antworten pauschal anhand der Sorgfaltsindikatoren Ausfüllzeit und Unterbrecherquote abzuschätzen. Die Ausfüllzeit dürfte stark mit der Antwortqualität korrelieren, denn das Auslassen von Items oder starke Antworttendenzen sparen Zeit. Problematisiert werden muss allerdings die unvermeidliche Imperfektion, welche aus der Abtrennung der Unterbrecher von den gültigen Teilnehmern anhand eines cut-off-Kriteriums resultierte. Außerdem ist fraglich, ob vor diesem Grenzwert eine lineare Beziehung zwischen Reliabilität und Ausfüllzeit bestand, da die Instruktion zu den Persönlichkeitsskalen lautete, möglichst spontan zu antworten. Über die Ausfüllzeit hinausgehend, wurde die Datenqualität nicht näher bestimmt, da z.B. keine offenen Fragen eingesetzt wurden. Eine direkte Auswertung des Item-Nonresponse als Qualitätsindikator wurde für die hiesige Untersuchung mit Persönlichkeitsskalen als unangebracht erachtet, da unklar ist, ob ein nicht beantwortetes Item die Reliabilität der Messung stärker gefährdet als ein nach Zufall angekreuztes. Sieht man über die geschilderten Messbarkeitseinschränkungen hinweg, schien die Untersuchungsqualität gut gewesen zu sein, denn die Teilnahmequote lag in allen Experimentalbedingen zwischen hervorragenden 76% und 86%. Bei der Ausfüllzeit fanden sich kaum und bei der Unterbrecherquote keine Unterschiede zwischen den Gruppen.
 
Empfehlungen für die Incentivierung in Online Panels
Tabelle 2 zeigt die pro Teilnehmer dieser Studie angefallenen Kosten in Abhängigkeit von der Versuchsbedingung. Zu den Kosten der Ausschüttung bei den Geldverlosungen wurden pauschal 2 DM pro erforderlicher Transaktion berechnet, denn die Gewinner müssen nach ihrer Bankverbindung gefragt, die Angaben müssen gesammelt und schließlich muss das Geld überwiesen werden. Es zeigt sich, dass bei Wahl einer günstigen Gratifikationsart und Höhe immense Kosteneinsparungen bei keinen oder vernachlässigbaren Qualitätseinbußen möglich sind.
 

Tabelle 2: Kostenaufstellung für das hiesige Experiment
 
Der Gratifikation mit Bonuspunkten ist eigen, dass die Kosten linear mit der tatsächlichen Teilnehmerzahl ansteigen. Bei Verlosungen hingegen fällt ein Festpreis an, egal wie viel eingeladene Panelisten letztendlich teilnehmen. Deshalb empfehlen sich Verlosungen um so mehr, je höher im Allgemeinen die Teilnahmeraten sind. Bei Bonuspunkten kann allerdings davon ausgegangen werden, dass eine Zahl von Punkten, die z.B. auch in Tabelle 4 als theoretische Kosten angefallen sind, nie eingelöst werden. Beispielsweise haben Einmal- oder Selten-Teilnehmer nicht genug Bonuspunkte, um etwas zu bestellen oder Panelisten beenden freiwillig ihre Panel-Mitgliedschaft und hinterlassen Punkte.
 
Dennoch sprechen die Zahlen und Untersuchungsergebnisse eine klare Sprache: Über eine Variation der Stückelung lässt sich kein Geld sparen. Man kann aber mit dem Aufwand haushalten, indem man eine große Stückelung wählt, weil dann geringere Transaktionskosten anfallen. Um den Panelbetrieb so effizient wie möglich zu gestalten, sollten als Standard Verlosungen mit geringem Betrag durchgeführt werden. Zur Abwechslung können Verlosungen von Sachgütern und falls ein Bonuspunkte-Verwaltungssystem bereits besteht, hin und wieder geringe Ausschüttung pro Panelist angeboten werden. Die Anschaffung einer teuren Bonuspunkte-Verwaltung lohnt sich hingegen nicht.
 

 
Literatur
 
Blau, P. (1964). Exchange and Power in Social Life. New York: Wiley.
 
Brennan, M. (1992). The effect of a monetary incentive on mail survey response rates: New data. Journal of the Market Research Society, 34, 173-177.
 
Cohen, J. (1977). Statistical power analysis for the behavior sciences. New York: Academic Press.
 
Göritz, A. S. (in preparation_a). A longitudinal experiment on gratification in online panels.
 
Göritz, A. S. (in preparation_b). Lotteries as rewards for online panelists.
 
Hippler, H.-J. (1988). Methodische Aspekte schriftlicher Befragungen: Probleme und Forschungsperspektiven. Planung und Analyse, 6, 244-248.
 
Pressley, M. M., & Tullar, W. L. (1977). A factor interactive investigation of mail survey response rates from a commercial population. Journal of Marketing Research, 14, 108-111.
 
Thibaut, J. W., & Kelley, H. H. (1959). The Social Psychology of Groups. New York: Wiley.
 
Walsh, J. P., Kiesler, S., Sproull, L. S., & Hesse, B. W. (1992). Self-selected and randomly selected respondents in a computer network survey.Public Opinion Quarterly, 56, 241-244.
 
Wärneryd, K.-E. (1996). Risk attitudes and risky behavior. Journal of Economic Psychology, 17, 749-770.
 

 
1Die Vorenthaltung einer Belohnung erscheint nur in solchen Panels gerechtfertigt, bei denen die zukünftigen Panelisten vor ihrer Registrierung informiert werden, dass manchmal auch Studien ohne materielle Entschädigung durchgeführt werden.


Gräf, Lorenz ; Institution: Globalpark GmbH, Hürth
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Optimierung von WWW-Umfragen: Three years after."


Größler, Andreas ; Wilhelm, Oliver ; Institution: Department of Psychology, Georgia Institute of Technology, Atlanta
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Online Testing of Business Administration Knowledge."


Hahn, André ; Jerusalem, Matthias Institution: Pixelpark AG, Berlin
Article preliminary article (version: 25/06/2002 - 07:47, size: 629)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Internetsucht: Befunde aus vier Online-Studien."


Heidingsfelder, Martin ; Bamert, Thomas Institution: Rogator AG, Nürnberg
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Reihenfolgeeffekte bei Web-Umfragen: Ergebnisse eines Methodenexperiments."


Heinicke, Anett ; Schumacher Jörg Institution: Institut für Angewandte Psychologie, Klinische und Gesundheitspsychologie, Universität Leipzig
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"ComRelax – ein internet-basiertes adaptives Streßbewältigungstraining für Menschen an Büroarbeitsplätzen."


Hemsing, Werner ; Institution: Globalpark GmbH, Hürth
Article (version: 25/06/2002 - 07:47, size: 17680)
"Methodentest unter Einsatz von Macromedia-FLASH-Technologie."
German:

Methodenvergleich unter Einsatz von Macromedia-FLASH-Technologie.
Die Möglichkeit der Darstellung von Ratio-Skalen in Web-Befragungen

Globalpark GmbH

1. Einleitung/Fragestellung

In der folgenden Studie geht es um den methodischen Vergleich zwischen dem Einsatz konventioneller (fünfstufiger) HTML-Radiobuttonskalen und einer kontinuierlichen Flash-Skala. Der Flash-Skala liegt eine Ratio-Skala mit 100 Werten zu Grunde.

Drei zentrale Fragestellungen stehen im Mittelpunkt des Methodentests:

  • Wie hoch ist der Anteil der Personen, die die Möglichkeiten zur Darstellung der Flash-Technologie haben und unterscheidet sich diese Gruppe systematisch von der Gruppe, die keinen flash-fähigen Browser zur Verfügung haben?
  • Welchen Effekt hat der Einsatz von Flash auf die Befragungsabbrüche?
  • Wird durch den Einsatz der Flash-Skalen die Datenqualität erhöht?

2. Untersuchungsdesign

2.1 Fragebogenaufbau

Insgesamt 1014 Teilnehmer eines Online-Panels wurden per E-Mail zu einer Umfrage zur Bewertung vier verschiedener Shopping-Portale eingeladen. Die Auswahl erfolgte an Hand eines geschichten Zufallsverfahrens. Jeweils die Hälfte der Befragten sollten einen reinen HTML-Fragebogen beantworten, die andere Hälfte entsprechend einen Flash-Fragebogen. Von den 1014 Personen begannen 681 Personen die Umfrage, von denen 73 Personen diese nicht beendet haben.

Bei der Gruppe, die der Flash-Umfragen zugewiesen werden sollte, wurde automatisch überprüft, ob das entsprechende Macromedia-Plugin zur Darstellung von Flash-Elementen installiert war. Falls nicht, so wurden die Befragten zu einer HTML-Version des Fragebogens weitergeleitet, die identisch mit dem Fragebogen war, die der HTML-Stichproben zugewiesen wurde.

Nach diesen vier Einzelbewertung wurden die Shops direkt miteinander verglichen und bewertet. Zu diesem Zweck sollten alle vier Shops bezüglich eines Items bewertet werden. In diesem Gesamtvergleich wurde ein Item pro Seite in einer Matrixfrage präsentiert.

Die erste Art der Bewertung der einzelnen Shops wird im folgenden Einzelbewertung genannt.
Die zweite Art der Bewertung wird im folgenden Gesamtvergleich genannt.

Die Unterschiede zwischen dem HTML- und dem Flash-Fragebogen bestanden in der Darstellung der Skalen. Während in der HTML-Version im Gesamtvergleich und der Einzelbewertung eine gleichbleibende fünfstufige Skala verwandt wurde, sollten beim Flash-Fragebogen zusätzlich zwei unterschiedliche Skalen benutzt werden.

Beim Einzelvergleich der Flash-Skala konnte der Befragte innerhalb einer eingezeichneten Linie durch anklicken eine Position "ankreuzen. Die relative Bewertung der Shops im Gesamtvergleich wurde mittels einer Skala bewertet, bei der die Logi der Shops auf einer Skala verschoben werden konnten.

Um möglichst exakt gleiche Bedingungen für beide Versuchsgruppen zu wahren, wurde auf eine Erläuterung der Skalen und einer Ausfüllhilfe verzichtet. Lediglich der rechte Extrempunkt war mit einem - Zeichen gekennzeichnet, wo hingegen der linke Extremwert analog mit einem + Zeichen gekennzeichnet wurde.

2.2 Abbruch- und Ausschöpfungsquote

Die Ausschöpfungsquote ist für Online-Befragungen akzeptabel. Die Ausschöpfungsquoten sind in der HTML-Stichprobe durchweg höher. Da jedoch die Abbruchquote annähernd konstant ist, handelt es sich nicht um ein methodisches Artefakt, sondern vielmehr um stichprobenneutrale Ausfälle.

Die Abbruchquote ist mit 10,4% in der Flash-Version zu 11,0% in der HTML-Stichprobe nahezu identisch. Die Stichproben unterscheiden sich nicht signifikant in den Abbrüchen voneinander. Die geringe Absolutanzahl der Abbrüche spricht für die hohe Qualität der Fragebogenkonzeption. Auf Grund der geringen Abbrecherzahl wird auf eine weitere Analyse z.B. der Korrelation mit der Zugangsgeschwindigkeit als irrelevant eingestuft.

Der Einsatz von Flash hat keinen negativen Einfluß auf die Befragungsabbrüche. Vorraussetzung dafür ist jedoch die Bereitstellung eines alternativen HTML-Fragebogens. Wird dieser nicht angeboten, dürfte die Abbruchquote der Personen, denen das Plugin nicht zur Verfügung steht, steigen. Im Folgenden soll geprüft werden, ob dadurch systematische Verzerrungen auftreten können.

3. Flash- vs. HTML-Nutzer

In diesem Kapitel werden die Nutzung des Internets und die zentralen soziodemographischen Variablen zwischen den Personen, die Flash nutzen können und denjenigen, deren Webbrowser nur in der Lage ist, pures HTML anzuzeigen, beschrieben.

3.1 Soziodemographische Unterschiede

252 der 307 Befragten der Flash-Befragung (82%), die an der Umfrage teilgenommen haben, konnten bereits zum Zeitpunkt der Umfrage Flash-Elemente mit ihrem Browser darstellen. Allerdings besteht ein Unterschied zwischen den Geschlechtern. Während 88,5% der Männer auf ihrem Rechner das Flash-Plugin installiert hatten, war dies "nur" bei 73% der Frauen der Fall. Dieser Unterschied ist auf dem 99,9% Niveau hochsignifikant.

Die Altersverteilung ist anders als erwartet. Im Durchschnitt sind die Flash-Nutzer etwas älter. Sieht man sich die Möglichkeit des Einsatzes der Flashtechnologie im Altersverlauf an, so stellt sich heraus, daß der Verlauf bis zu etwa einem Alter von 40 Jahren nahezu linear ansteigt. Der Altersverlauf der Befragten, die ausschließlich HTML nutzen können, steigt hingegen treppenförmig an und bleibt ab einem Alter von Mitte 30 nahezu konstant. Sehr junge Menschen meiden somit den Einsatz des Macromedia Plugins, wo hingegen Personen im mittleren Alter der Technologie aufgeschlossener gegenüber stehen.

Der Bildungsvergleich zeigt, daß in den beiden Gruppen der Personen, die einen niedrigen Bildungsabschluß haben und in der, die die (Fach-)hochschulreife besitzen, der geringste Anteil an Flash-Nutzer ist. Dieses Ergebnis korrespondiert mit dem Altersverlauf. Während jüngere Menschen zum einen sich noch in der Schullaufbahn befinden, erreichen sie zum anderen aber nach Abschluß der Schule ein höheres Bildungsniveau gegenüber älteren Menschen. Der Zusammenhang zwischen Flash-Nutzung und Bildung gilt jedoch ausschließlich für Frauen. Deutlich wird dies bei einem hohen Bildungsabschluß: 65% der Flash-Nutzung bei den Frauen stehen 84% bei den Männern gegenüber. Der Bildungsunterschied ist nur für die Gruppe der Frauen auf dem 95%-Niveau signifikant.

Weiterhin nutzen die Personen Flash, die länger im Internet sind. Während unter den Kurznutzern (unter 5 h pro Tag) nur 69% ein Flash-Plugin haben, steigt der Wert für die Gruppen mit einer Nutzungsdauer von mehr als 6 h sprunghaft auf 82-89% an. Auch dieser Unterschied ist auf dem 95%-Niveau signifikant. Zwischen Männern und Frauen besteht kein wesentlicher Unterschied. Eine Erklärung für die längere Verweildauer dürfte sein, daß durch intensiveres "surfen" die Wahrscheinlichkeit größer wird, auf eine Seite zu stossen, die ein Flash-Plugin benötigt.

Das Einkaufsverhalten via Internet korrespondiert bei den Frauen mit der Flash-Nutzung. Während nur 1/3 der Frauen, die noch nie über das Internet eingekauft haben, das Flash-Plugin installiert haben, sind dies bei den anderen Gruppen zwischen 77% und 82%. Die Nutzungsquote von Flash bei Männern ist annähernd konstant. Die Unterschiede sind bei den Frauen auf dem 99%-Niveau hoch signifikant.

4. Methodischer Vergleich Flash-Skala

4.1 Transformation und Kategorisierung

Der methodische Vergleich kann nur erfolgen, wenn die selbe Skaleneinheit zu Grunde liegt. Zwei unterschiedliche Konzepte werden im folgenden verwandt.

  1. Kategorisierung. Die ehemals 100-stufige Flash-Skala wird zur Vergleichbarkeit in fünf Intervalle unterteilt.
  2. Transformation. Die fünfstufige HTML-Skala wird in eine pseudo 100-stufige Skala transformiert.

Nach der Kategorisierung sind die Extremwerte der Flash-Gruppe nicht bei allen Items stärker besetzt als bei der HTML-Gruppe. Dies widerspricht den Erkenntnissen aus der Offline-Forschung. Nur die schlechteste Bewertung - d.h. der Wert 1 - weist nahezu konstant bei allen Fragen eine höhere Besetzung beim Flash-Fragebogens auf, als dies beim HTML-Fragebogen der Fall ist. In allen anderen Kategorien sind die Unterschiede uneinheitlich und folgen keinem bestimmten Schema.

Im Gesamtvergleich hingegen scheinen die Befragten des HTML-Fragebogens häufiger die Extremwerte zu nutzen. Als Grund könnte man annehmen, daß die relative Bewertung der einzelnen Shoppingportale verlangt, daß zur Abstufung auf die Extremwerte zurückgegriffen werden muß. Als Beispiel sei genannt, daß eine Person, die den Shop X gut bewertet möchte und ihm somit z.B. den Wert vier gibt, bei der Bewertung von Shop Y zwangsläufig den Wert fünf vergeben muß, wenn Y besser als X eingeschätzt werden soll. Flash-Skalen profitieren hingegen von einer feineren und differenzierteren Möglichkeit der Abstufung, die durch die Kategorisierung wieder verloren geht.

4.2 Missing-Analyse

Die erstaunlich hohe Zahl der Mittelkategorie - und zwar nicht nur des Wertes drei in der Kategorisierung, sondern des einzelnen Wertes 50 - im Gesamtvergleich und die hohe Anzahl der Missings deutet darauf hin, daß die User den Fragebogen mißverstanden haben. Problemverschärfend kommt hinzu, daß sich die Flash-Skalen zwischen der Einzelbewertung und dem Gesamtvergleich unterscheiden. Im folgenden soll zunächst für den Gesamtvergleich eine Missinganalyse vorgenommen werden.

Nur 45% der Flash-Nutzer (111) haben bei allen Logi gültige Werte. Von diesen haben aber nur 88 Personen auch alle Logi verschoben. Prozentuiert auf die Gesamtzahl der Flash-Nutzer sind dies nur 35,8%. Etwas mehr als nur ein Drittel der Flash-Nutzer haben die Skala voll ausgenutzt. Schwächt man den Anspruch etwas ab und zählt auch die Personen hinzu, die einen oder mehrere Shops in der Mitte der Skala haben stehen lassen, so erhöht sich der Prozentsatz auf 45,1%. 7,3% der Flash-Nutzer haben die Seite ohne Anklicken auch nur eines Logos verlassen. Ein weiterer großer Teil der Flash-Nutzer (37,8%) hat nur ein Logo angeklickt bzw. auch bewegt. Von diesen haben wiederum nur 1/3 ein Logo angeklickt und nicht bewegt.

Die Befragten hatten also bei dieser neuen Art von Skala große Schwierigkeiten mit der Handhabung. Aus Gründen der Vergleichbarkeit der HTML- und Flash-Skalen wurde auf eine Erläuterung der Skala im Rahmen dieses Methodentestes verzichtet.

Erschwerend kommt hinzu, daß das Verschieben eine höhere Vertrautheit des Nutzers mit der Maus erfordert.

Aufgrund der hohen Zahl von fehlenden Werten bzw. der schwer einzuschätzenden Mittelkategorien beim Gesamtvergleich werden wir uns bei der weiteren Analyse auf die Ergebnisse des Einzelvergleichs beschränken. Aber auch hier müssen die Verteilung der fehlenden Werte genauer betrachtet werden.

Die erste Frage in einer Itembatterie hat bei allen Portalen der Flash-Skala den geringsten Anteil fehlender Werte von 7-8%. Ähnliche Ergebnisse weist die HTML-Skala auf.

Anders hingegen bei den folgenden Items. Während die HTML-Version einen nahezu konstanten Missing-Anteil von 8,5% (7-10%) der Probanden aufweist, liegt dieser bei der Flash-Skala zwischen 45 und 50%! Auch bei dieser neuen Flash-Skala hatte rund die Hälfte der Befragten anscheinend Schwierigkeiten.

Der hohe Ausfall in der Flash-Fragebogenversion kann auch hier darin begründet liegen, daß es keine klaren Ausfüllanweisungen gab. Um die Vergleichbarkeit zwischen den beiden Versionen zu gewährleisten, wurde den Probanden nur der Fragetext und die Antwortskalen präsentiert. Während die Befragten der HTML-Version scheinbar vertraut mit der Beantwortung auf Basis von Radio-Buttons sind, so sind die Flash-Skalen kein Standard und bedürfen der näheren Erläuterung. In Zukunft könnten die Umfrageteilnehmer langsam mit konkreten Handlungsanweisungen an die Flash-Skala heran geführt werden.

4.3 Mittelwert- und Streuungsvergleich

In der Analyse des Einzelvergleichs zwischen Flash- und HTML-Skalen ergeben sich nur geringe Unterschiede beim Mittelwert. Zwar sind die Mittelwerte bei Flash-Skalen etwas niedriger, jedoch sind nur vier von 24 Unterschieden signifikant.

Auffallend sind die z.T. parallelen Verläufe der Flash- und HTML- Mittelwertkurven bei den Shops 2-4 und z.T. auch bei der Berurteilung von Shop 1. Es findet also eine annähernd gleiche Einschätzung der vier Portale bei den Flash- und HTML-Skalennutzern statt. Neben den bereits beschriebenen Useability-Problemen bei der Handhabung der Flashskalen, ist dies eines der zentralen Ergebnisse dieses Methodentests. Der Einsatz von kontinuierlichen Flash-Skalen führt zu keinem wesentlich anderen Ergebnis im Vergleich zur herkömmlichen - und von den Befragten kognitiv besser zu bewältigende - HTML-Skala.

In der Beurteilung des ersten Shops treten zwar die meisten Unterschiede zwischen den Flash- und HTML-Skalen auf, diese Unterschiede sind jedoch bei der Einschätzung der anderen Portale nicht zu finden und es ist auch keine Systematik zu erkennen.

Die Streuung ist tendenziell bei den Flash-Umfragen etwas größer, jedoch sind diese Unterschiede äußerst klein und der Levene-Test auf Varianzengleichheit lieferte nur für ein Item eines Shops ein signifikantes Ergebnis.

5. Fazit

Flash-Skalen sind allgemein dann sinnvoll einsetzbar, wenn es um kontinuierliche Skalen geht. Besonders eignen sie sich bei Fragen mit Gegensatzpaaren und -polen, wie von semantischen Differentialen und + und - Polen, da sie die volle Bandbreite ausschöpfen können.
Dieser Methodentest zeigt, daß bei den verwendeten kontinuierlichen Flash-Skalen keine wesentliche Verbesserung der Datenqualität gegenüber herkömmlichen fünfstufigen Skalen erreicht werden konnte. Der weiteren Grundlagen- und Methodenforschung bleibt vorbehalten, spezifischere Erkenntnisse über das Antwortverhalten herauszufinden, wenn die Befragten nicht mit der neuen Technologie alleine gelassen werden. Dort kann auch Szenarien erarbeitet werden, welche Formen der Ausfüllanweisung zu bevorzugen sind.

Als Fazit läßt sich sagen, daß mit der Möglichkeit der Einbindung einer Flash-Skala sich die Palette der Antwortskalen in der Online-Forschung sinnvoll erhöhen kann. Layouteffekte, die sich durch den Browser, das Betriebssystem und die Einstellung der Nutzer ergeben, werden minimiert, da die Flash-Technologie verspricht, weitgehend unabhängig von der Software der Computer die gleiche Ausgabe zu erzeugen. Die Anzahl der Personen, die Flash nutzen können ist hoch, jedoch nicht für alle Fälle ausreichend und hängt letztendlich von der untersuchten Grundgesamtheit ab.

Der Informationsgewinn durch die differenzierte Skala kann durch weitere Forschung in diesem Bereich verbessert werden. Dort kann auch bestimmt werden, welche Form der Skala den größten Gewinn versprechen. Dieser Methodentest legt nahe, daß insbesondere die Variante mit den verschiebbaren Logi zum jetzigen Zeitpunkt nicht sinnvoll erscheint.

Zusammenfassend müssen folgende Punkte erfüllt sein, um einen erfolgversprechenden Einsatz zu gewährleisten. In der Analyse dieser Punkte sollte auch der Fokus weiterer Forschung liegen.

  • Tatsächlich metrische Antwortmöglichkeiten (z.B. semantisches Differential, Gegensatzpole).
  • Kontrolle der Downloadzeit der Fragebogenseite.
  • Verständlichkeit der Fragen, der Antworten und der Erläuterung dieser.
  • Useability. Wird der Fragebogen bei möglichst vielen Nutzern mit unterschiedlichen Verbindungsgeschwindigkeiten und Rechner überhaupt in einer vertretbaren Form angezeigt.
  • Beobachtung des Nutzungsanteils der Flash-Plugins in unabhängigen Befragungen.
  • Alternativfragebogen in HTML.
  • Die interpretierten Skalenpunkte dürfen nicht zu weit gespannt sein. Die Reliabilität kann nur gewährleistet werden, wenn es dem Befragten möglich ist, bei der gleichen Einstellung auch wieder auf demselben Skalenpunkt zu antworten.
  • Der Einsatz von Hilfsmitteln zur Erläuterung des Umgangs mit den Flash-Skalen.
Nur reifliche Vorüberlegungen und Tests machen somit den Einsatz von Flash-Antwort-Elementen möglich. Viele der aufgetretenen Probleme lassen sich als "Kinderkrankheiten" eines neuen Typus von Antwort-Skalen charakterisieren. Der umsichtige Gebrauch erweitert die Palette der Skalen in der Online-Forschung um einen Bereich, der schwer bei schriftlichen Offline-Umfragen und gar nicht bei Telefon-Studien eingesetzt werden kann.

Der Einsatz von Flash bedeutet einen Schritt in die Richtung wirklicher multimedialer Gestaltung von Fragebögen. Analog zu den ersten Versuchen mit Telefoninterviews bedeutet dies, daß ein weites Untersuchungsfeld für die Grundlagenforschung entsteht, welches erst im Laufe der Zeit zu einem validen Meßinstrument reift.

Copyright

Werner Hemsing, Holger Nowak

2001-05-11, Globalpark GmbH


Hesse, Friedrich W. ; Institution: Institut für Wissensmedien (IWM), Eberhard-Karls-Universität Tübingen
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Lehren und Lernen im virtuellen Raum."


Hildebrandt, Michael ; Meyer, Herbert A.; Janetzko, Dietmar ; Institution: Georg-Elias-Müller-Institut für Psychologie, Georg-August-Universität Göttingen
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Das experimentalpsychologische Praktikum im Labor und WWW."


Höflich, Joachim ; Rössler, Patrick Institution: Universität Erfurt
Article (version: 25/06/2002 - 07:47, size: 24036)
"Email für das Handy: SMS-Nutzung durch Jugendliche."
German: E-Mail für das Handy - SMS-Nutzung durch Jugendliche

Joachim R. Höflich / Patrick Rössler, Universität Erfurt

1. Vorbemerkung

Im vergangenen Jahr nahm die Verbreitung des Handys mit einer Wachstumsrate zu, die jene anderer Medien, einschließlich des Internets, in den Schatten stellt. Besonders sticht dabei hervor, dass das Handy nicht allein zum Telefonieren, sondern auch und gerade dazu dient, kurze Textnachrichten zu versenden. Angesprochen ist der Short Message Service (SMS), mittels dem über das Tastenfeld das Handys, aber auch via Internet kurze Botschaften mit einem Umfang von (bislang) bis zu 160 Zeichen an andere Handy-Nutzer übermittelt werden können. Im vergangenen Jahr wurden knapp 15 Milliarden solcher Nachrichten versandt - und damit verbunden ist im Vergleich zum Jahr 1999 ein Wachstum von 163 Prozent. Durchschnittlich kamen dabei pro Monat 35 Kurzmitteilungen auf einen Netzteilnehmer, wobei Schätzungen zufolge gut die Hälfte privaten Zwecken diente (vgl. O.N. 2001a, b).

Das Handy ist ein weiteres Hybridmedium, das sich eingedenk der damit verbundenen Verwendungsweisen zu einem Universalmedium entwickelt soll. Es steht ferner unter dem Vorzeichen der Konvergenz, indem sich Funktionalitäten, die bislang mit differenten Medien verbunden waren, in einem Medium vereinen. Es steht aber auch in dem Sinne für eine Konvergenz, indem intermediale Verbindungen, insbesondere zwischen Handy und Computer bzw. Handy und Internet hergestellt werden. Das bezieht sich auf die Möglichkeiten, SMS-Botschaften vom Computer an das Handy und umgekehrt zu versenden, aber auch darauf, dass auf der Basis des Wireless Application Protocoll (WAP) ein mobiler Zugriff zu den Diensten des Internets möglich ist. Der anstehende und für die Netzbetreiber hierzulande teuer erstandene UMTS-Standard (Universal Mobile Telecommunications System) setzt nun nachgerade voraus, dass das Handy zu mehr als nur zum Telefonieren verwendet wird; nur über die Nutzung von Diensten ist Geld zu verdienen. Und dieses einzutreiben ist zwingend erforderlich: UMTS-Endgeräte kosten die Netzbetreiber um die 6000 DM pro Kunde, jeder deutsche Lizenznehmer muss 100.000 DM pro Stunde erwirtschaften und die Durchschnittskunden sollen statt heute um die 70 zukünftig 100-200 DM pro Monat ausgeben. (Klemann 2001).

Enorm sind vor allem die Erwartungen, die man mit der kommerziellen Verwendung eines mobilen Kommunikationsgerätes, dem M-Commerce verbindet, wobei nicht zuletzt die SMS-Dienste als ein Vehikel dazu gesehen werden. Nachdem gerade die Jugendlichen nicht nur das Handy sondern vor allem den Short Message Service für sich entdeckt haben, stellen diese eine bevorzugte Zielgruppe dar. Vor einigen Wochen trat beispielsweise die Tochter des finnischen Konzerns Sonera auf dem deutschen Markt auf, um Jugendlichen Handyisten mit ihren Angeboten zu gewinnen, wobei Partner wie die Verlagsgruppe Milchstrasse (Max, Amica, Cinema), Merian, der Nachrichtendienst Reuters oder Trivial Pursuit die Inhalte liefern.

2. Theoretische Verortungen

Noch im Vorfeld solcher Aktivitäten, aber inmitten des Handy- und SMS-Booms haben wir im Juli vorigen Jahres eine Studie zur Nutzung des Short Message Service durchgeführt -nicht ahnend, dass es sich um ein solches Wachstumsfeld handeln würde. Es war im übrigen um die erste kommunikationswissenschaftliche Studie auf diesem Terrain, aus der wir einige zentrale Ergebnisse zur Diskussion stellen wollen.

Vor dem theoretischen Hintergund der Forschungstradition des Uses-and-Gratifications-Ansatzes aus der Kommunikationswissenschaft (vgl. zusammenfassend etwa Schenk 1987) haben wir uns dem Thema insbesondere unter zwei Perspektiven genähert:

Steht die Verbreitung des Short Message Service in einem engen Zusammenhang mit der hervorstechenden Bedeutung asynchroner Kommunikationsformen, so dass man bei der SMS-Nutzung durchaus von einer E-Mail für das Handy sprechen kann?

Ist die Verwendung des Short Message Service gerade im Kontext einer umfassenden Mediatisierung des Alltags Jugendlicher zu sehen - und welche spezifischen Funktionalitäten und Formen der Aneignung kennzeichnen diese Nutzungsofferten?

Schon der Siegeszug der E-Mail, als die herausragende Nutzungsform des Internet, mag sich daraus erklären, dass man damit der Aufdringlichkeit unmittelbarer medialer Kontaktnahme wie über das Telefon entkommen konnte, denn Telefonieren ist, wie Freyermuth (1999) anmerkt, eine "herrschaftsförmige Aktivität, bei der eine Partei der anderen ihre Zeit aufzwingt". So gesehen steht die E-Mail weniger in einem Konkurrenzverhältnis zum Brief, sondern vielmehr zum Telefon. In diesem Sinne hat etwa Nicholas Negroponte (1997, 232) festgestellt: "Neben ihren digitalen Vorteilen ist die E-Mail eher ein Sprachmedium. Auch wenn es sich nicht um einen gesprochenen Dialog handelt, kommt es doch dem Sprechen näher bzw. dem Versenden von Briefen." Bei der mobilen Telefonie wird die Ubiquität der Erreichbarkeit und damit die Aufdringlichkeit auf die Spitze getrieben. Schon sein "inappropriate sound" (Ling 1997) - der bis hin zu äußerst lauten und manchmal nie enden wollenden Melodien, vom Pop bis Klassik (was immer die Handybesitzer damit sagen wollen) - lässt Dritte nicht unberührt. Als aufdringlich wird aber auch das öffentliche Telefonieren als solches wahrgenommen. Es stört nämlich die öffentliche Ordnung, weil es die "Interferenz zweier Kommunikationsformen" (Burkart 2000, 218), einerseits der öffentlichen andererseits der privaten ermöglicht. So hat man es gerade deshalb mit Störungen zu tun, weil die bislang vertrauten Regeln einer öffentlichen und einer privaten Kommunikation verletzt werden.

Der Aufdringlichkeit zu entkommen vermag das ‚Silent Text Messaging' des Short Message Service zu entsprechen. In einem Büchlein mit SMS-Sprüchen ist denn auch zu entnehmen: "Immer mehr Handy-User verschicken SMS. Der entscheidende Vorteil gegenüber dem normalen Telefonieren (abgesehen von Preisvorteilen): die Nachrichten werden geräuschlos übermittelt. So kann man sich, ohne jemanden zu stören, über langweilige Konferenzen oder Schulstunden hinwegretten und weiterhin mit der geliebten Welt in Verbindung bleiben. Auch aus öffentlichen Verkehrsmitteln kann man mit seinen Liebsten in Kontakt treten, ohne dass der ganze Großraumwagen mithört" (Jochmann 2000, 4/5). So gesehen steht der Short Message Service im Zusammenhang mit einer ‚Dialektik des Gebrauchs' (Höflich 1998: 212) - hier: von der Aufdringlichkeit hin zur Unaufdringlichkeit.

Der Alltag Jugendlicher ist, so ausgeprägt wie noch nie, ein Medienalltag, wiewohl dieser nicht nur durch die Massenmedien, sondern auch und gerade durch Medien interpersonaler Kommunikation - vom Telefon bis hin zum Handy und dem SMS - bestimmt wird. Sucht man nach einen entsprechenden Terminus, so könnte, eingedenk der quantitativen Verbreitung in einem bestimmten Alterssegment, von einer "Handy-Generation" gesprochen werden, die über das Telefon hinaus die Potentiale der mobilen Kommunikation für sich zu eigen macht. Bemerkenswert bei der Nutzung des Short Message Service ist, dass selbst jene Kids Kurznachrichten schreiben und via Handy versenden, die ansonsten nie zum Schreiben gekommen wären. Wie die aktuelle Shell Jugendstudie zeigt (vgl. insbesondere Fritzsche 2000), ist das Handy vor allem ein Medium der (groß)städtischen Jugend. Insbesondere vor diesem Hintergrund gingen wir davon aus, dass es dabei besondere Funktionalitäten hinsichtlich der Organisation des Alltags hat und vor allem dazu dient, sich mit anderen zu verabreden und in Kontakt zu bleiben, ohne den Zwängen der örtlichen Bindung an das häusliche Telefon zu unterliegen. Nicht zuletzt sollte auch das spielerische Moment nicht vergessen werden, das nicht zuletzt bei der Aneignung des Computers durch Kinder und Jugendliche einen zentralen Stellenwert einnimmt (vgl. Weiler 1999: 221). Spielerisch lernt man - und das gilt nicht nur für Jugendliche - die Handhabung von Technik als Objekt, wie auch, unter den besonderen Bedingungen eines Mediums mit anderen umzugehen. So mag gerade das Experimentelle die Nutzung des Short Message Service zu leiten, z.B. um im Schutze des Verborgenseins mit anderen (und bislang Fremden) zu flirten.

3. Methodisches Vorgehen und Forschungsergebnisse

Um erste Einsichten in die SMS-Nutzung Jugendlicher zu gewinnen, haben wir im Juli 2000 eine mündliche Befragung von 204 Handy-Besitzern im Alter zwischen 14 und 18 Jahren aus verschiedenen Regionen Deutschlands durchgeführt. Die Feldarbeit wurde von Teilnehmern zweier Projektseminare an den Universitäten Erfurt und Augsburg geleistet, für deren persönliches Engagement wir herzlich danken. Die Untersuchungsteilnehmer wurden nach dem Zufallsprinzip an öffentlichen Einrichtungen oder an öffentlichen Plätzen kontaktiert; allerdings handelt es sich dabei keinesfalls um eine gezogene Zufallsstichprobe aus der Grundgesamtheit jugendlicher Handy-Nutzer, weshalb das Datenmaterial keinen Anspruch auf Repräsentativität erheben kann. Da zum Zeitpunkt der Feldarbeit auch noch keine gesicherten Informationen über die soziodemographische Struktur der relevanten Zielpersonen verfügbar waren, musste auf die Vorgabe von Quotierungsmerkmalen verzichtet werden. Es kann daher nur spekuliert werden, dass das Bildungsniveau unserer Stichprobe leicht überdurchschnittlich ausgefallen sein könnte, denn 43 % der Befragten besuchten ein Gymnasium (auch Fachgymnasium), 32 % eine Real- oder Hauptschule und 25 % absolvierten seinerzeit eine Berufsausbildung. Das Durchschnittsalter der Teilnehmer betrug 16,4 Jahre, 45 % waren männlichen und 55 % weiblichen Geschlechts.

Voraussetzung für die Partizipation an der SMS-Kommunikation ist der Besitz eines Handys. Die in unserer Stichprobe befragten Jugendlichen zwischen 14 und 18 Jahren geben im Schnitt knapp 70 DM monatlich für ihr Handy aus, Telefon- und SMS-Kosten zusammengenommen. Den größten Marktanteil unter den von uns befragten Nutzern hatte dabei D2; erst mit erheblichem Abstand folgen zunächst Telly D1, und dann erst E-Plus und Viag Interkom. Dabei ist der Erfolg der Prepaid-Karte als Einstiegsangebot klar abzulesen: Jugendliche unter 16 Jahren (die über weniger Mittel verfügen und erst seit kurzem ein Handy besitzen) nutzen vorwiegend Prepaid-Karten. Mit dem Alter und der zunehmenden Erfahrung mit Handys wächst auch der Anteil Jugendlicher, die einen Festnetz-Vertrag abschließen. Damit kann die Prepaid-Karte auch als wichtiger Motor für die Marktdurchsetzung von SMS unter Jugendlichen gelten. Denn während mit 14 erst knapp die Hälfte der Jugendlichen ihr Handy selbst finanzieren, springt dieser Anteil auf gut 60 % mit 15 und klar über 70 % mit 17 Jahren. Trotzdem lässt sich immerhin noch ein Viertel der volljährigen Jugendlichen ihr Handy von anderen bezahlen.

Bei der Bestimmung der zentralen Gratifikationsdimensionen, die die Jugendlichen mit der SMS-Nutzung verbinden, bot es sich an, auf die wenigen existierenden Studien zu Gratifikationen der Telefon- bzw. E-Mail-Nutzung zurückzugreifen: In ihrer vergleichenden Erhebung unterschiedlicher Kommunikationsmodie belegten Flanagin und Metzger (2001) die Ähnlichkeit der Motive für Telefon- und E-Mail-Nutzung. die (gemeinsam mit den Internet-Konversationen im Chat oder Usenet) einen gemeinsamen Faktor der mediatisierten interpersonalen Kommunikation konstituieren. Zuvor hatten Dimmick u.a. (1994) in ihrer Studie zu den "Gratifications of the Household Telephone" mit Soziabilität und Instrumentalität zwei zentrale Faktoren berechnet, die die Autoren als Soziabilität (Prozess sozialer Integration) und Instrumentalität (Prozess sozialer Koordination) benennen. Mit dem Telefon in einem besonderen Maße verbunden ist eine dritte Dimension, die die Autoren als psychologisches Bedürfnis nach Rückversicherung ("psychological need for reassurance") bezeichnen. Gemeint sind damit Nutzungen zu dem Zweck, sich beispielsweise darüber Gewissheit zu verschaffen, dass es den Freunden oder der Familie gut geht. Diesbezügliche Nachrichten müssen nicht unbedingt lang sein, meist genügt dazu schon ein kurzer Anruf. Da der Short Message Service gerade für solche Kurzbotschaften gut geeignet ist, wurde als Arbeitshypothese angenommen, dass das Moment der Rückversicherung dort ebenfalls eine wichtige Rolle spielt. Weitere Studien (vgl. O'Keefe/Sulanowski 1995; Leung/Wei 2000) betonen außerdem die Motivdimension "Unterhaltung"/"Vergnügen", die auf die erwähnte spielerische Aneignung auch des SMS verweisen.

In Anlehnung an die erwähnten Gratifikationsstudien legten wir den Befragten 15 Motivationsitems zur Beurteilung anhand einer fünfstufigen Skala vor. Die Vorgaben lauteten: Ich schreibe und empfange SMS-Kurznachrichten... (1) um meine Probleme mitzuteilen und mir Ratschläge zu holen; (2) um anderen Ratschläge zu geben; (3) um zu wissen, dass Leute an mich denken und sich um mich kümmern; (4) um den Kontakt zu meinen Freunden nicht zu verlieren; (5) um zu wissen, was meine Freunde oder mein Partner gerade macht / ob es ihnen gut geht; (6) weil meine Freunde / mein Partner wissen möchten, was ich gerade mache / ob es mir gut geht; (7) weil ich in manchen Situationen nicht telefonieren kann (es würde auffallen, wenn ich telefoniere); (8) um Verabredungen zu machen / Unternehmungen etc. zu planen; (9) weil es mir Spaß macht mit vielen Leuten zu tun zu haben; (10) um mit Leuten in Kontakt zu bleiben, die ich nicht persönlich treffen kann; (11) in Notsituationen (Unfall etc.); (12) um ständig erreichbar zu sein; (13) weil es mir Spaß macht die technischen Möglichkeiten des Geräts auszuprobieren; (14) um mir Informationen (Wetterbericht, Horoskop etc.) einzuholen; (15) um mir die Zeit zu vertreiben, wenn ich Langeweile habe.

Breite Zustimmung erhielten hierbei die Vorgaben, man würde SMS schreiben und empfangen, um Verabredungen zu treffen und um sich nach dem Befinden der Freunde zu erkundigen. Generell werden insbesondere diejenigen Motive als besonders zutreffend beschrieben, die sich auf Aspekte gegenseitiger Vergewisserung beziehen. Kaum verwundern kann daneben die Tatsache, dass die Befragten das Alleinstellungsmerkmal von SMS betonen, nämlich allzeit asynchron erreichbar zu sein und per Mobilkommunikation mit denen zu interagieren, die man nicht persönlich treffen kann. Mehr als die Hälfte der Jugendlichen setzt SMS dabei häufig als funktionales Äquivalent für Telefonate ein. Von untergeordneter Bedeutung, aber keineswegs ausgeschlossen sind komplexere Bedürfnisse wie die Erörterung von persönlichen Problemen oder das Erteilen von Ratschlägen via SMS - hier dürften sich die Restriktionen in der Medialität niederschlagen (Textbasiertheit, gebrenzte Zeichenzahl, geringer Bedienungskomfort).

Mit Hilfe einer Faktorenanalyse (Hauptkomponentenanalyse mit Varimax-Rotation, Eigenwertkriterium > 1, Varianzaufklärung durch 5 Faktoren = 57%) lassen sich die abgefragten Motive auf fünf Nutzungsdimen-sionen verdichten. Zentrales Nutzungsmotiv ist demnach die gegenseitige Rückversicherung (Items 5 und 6, MW 2,04) - zu erfahren, was die Freunde oder der Partner machen und ob es ihnen gut geht bzw. selbst mitzuteilen, was man macht und wie es einem geht. Am zweitwichtigsten scheint den Jugendlichen die allgemeine Kontaktpflege (Items 7 bis 10, MW 2,39): man verabredet sich oder schickt Mitteilungen um ihrer selbst willen, einfach weil es Spaß macht, und sendet SMS-Botschaften an Leute, die man gerade nicht persönlich treffen kann oder mit denen man in der Situation nicht telefonieren kann. Fast gleichbedeutend ist die Verfügbarkeit des Mediums (Items 11 und 12, MW 2,43), beispielsweise in Notsituationen, gepaart mit der ständigen Erreichbarkeit. Bereits deutlich weniger relevant sind Aspekte der Lebenshilfe (Items 1 bis 4, MW 3,23), z.B. das gegenseitige Rat geben oder die Bindung an die Freunde in dem Wissen, dass andere Leute an einen denken. Die von den SMS-Nutzern favorisierten Anwendungen liegen demnach ebenfalls klar auf der Hand - ihrer persönlichen Einschätzung nach benutzen sie die SMS fast täglich, um den Kontakt zu ihren Freunden zu pflegen und mit ihnen Informationen auszutauschen oder Treffpunkte zu vereinbaren usw. Dagegen besitzt der Abruf standardisierter Informationen (Wetterbericht, Horoskope etc.) eine vergleichsweise geringe Bedeutung, und auch die flirt-bezogene Kontaktaufnahme mit unbekannten Handy-Besitzern findet eher selten statt. Während Informationen durch SMS-Kommunikation also von untergeordneter Bedeutung sind, interessaieren sich die Jugendlichen doch stark für Informationen über den SMS. Der SMS-Markt wird deswegen auch Gegenstand interpersonaler Kommunikation zwischen Jugendlichen ist, denn über die Hälfte der Befragten (51,5 %) gab an, sich mit den Freunden häufig oder manchmal über günstige SMS-Anbieter oder neue technische Entwicklungen zu unterhalten. Diese Befunde unterstreichen die Bedeutung des SMS als Medium der Jugendlichen zur Organisation ihres städtischen Alltags.

Insgesamt haben die Befragten die SMS-Nutzung also längst in ihr Kommunikationsverhalten integriert: Durchschnittlich drei Handy-Telefonaten pro Tag stehen etwa sechs SMS-Nachrichten gegenüber, die sowohl geschickt als auch empfangen werden. Auch die Handlungsalternative E-Mail spielt selbst in der Teilmenge von Personen, die überhaupt das Internet nutzen, von der Frequenz her eine geringere Rolle (ca. 2 Nachrichten pro Tag geschickt/empfangen), wobei diese Angaben durch den variierenden Umfang der Kommunikationsakte relativiert werden: SMS-Botschaften müssen aus technischen Gründen sehr kurz ausfallen (max. 160 Zeichen), während E-Mails prinzipiell länger sein können und gerade bei Telefonaten meist ein deutlich intensiverer Austausch vorliegen dürfte. Detailanalysen belegen sowohl für die Handy- als auch für die SMS-Nutzung den diffusionstypischen U-Verlauf: Nach einer intensiveren Phase des Ausprobierens geht die Nutzung zunächst zurück, bevor die Gewöhnung an das Medium und die Einbettung in den Alltag einsetzt. Die Zusammenhänge zwischen den einzelnen Kommunikationshandlungen lassen sich durch Korrelationsberechnungen verdeutlichen. Auf der Hand liegt wohl, dass Jugendliche, die viele SMS verschicken, umgekehrt auch viele empfangen (Pearson's r = .79), und ähnliches gilt für die Verwendung von E-Mail (.85). Interessant ist allerdings, dass die Zahl geführter Handy-Telefonate mit allen weiteren Alternativen korreliert - wer viel mobil telefoniert, verschickt und empfängt auch häufiger SMS (.40 bzw. .35), E-Mails (.27 bzw. .24) und schreibt sogar öfters einmal einen Brief (.15). Dies deutet darauf hin, dass die Handy-Aktivitäten der befragten Jugendlichen als ein generelles Indiz für das Ausmaß technisch vermittelter interpersonaler Kommunikation gelten könnte.

Um die Verknüpfung von SMS- und Online-Kommunikation - schliesslich können die Kurzbotschaften auch via Internet auf Handys verschickt werden und umgekehrt - näher zu beleuchten, wurde die Nutzung dieser Option abgefragt. Insgesamt geben mehr als dreiviertel der Befragten (77,4 %) an, daß sie "nie" Nachrichten von ihrem Handy ins Internet schicken würden; gerade zwei Jugendliche tun dies eigenen Angaben zufolge "häufig", und nur etwa jeder zwanzigste (5,5 %) zumindest manchmal. Umgekehrt verschickt allerdings die Hälfte der Jugendlichen, die überhaupt das Internet nutzen (n = 108), SMS-Kurznachrichten über das Internet (48,1 %). Der Zusammenhang mit anderen Kommunikationshandlungen ist nicht eindeutig (vgl. erneut Tab. 1): Während bei der Zahl der Handy-Telefonate kein Unterschied besteht, scheinen jugendliche Internet-Nutzer, die SMS über das Internet verschicken, tendenziell eher häufiger E-Mail zu nutzen und tendenziell weniger häufig die SMS. Es wäre daher zu vermuten, daß Online-Nutzung für diese Jugendlichen den dominanten Kommunikationsstil repräsentiert, in den auch die SMS-Anwendung eingeordnet wird.

4. Schlussbemerkung

Die Handy-Euphorien des letzten Jahres sind - gerade nach dem rapiden Wachstum - merklich gedämpft. Nun zeigen sich die Schattenseiten der Entwicklung einer großzügigen Subventionierung des Handyvertriebs, für die man sich entschied, nur um schnell große Nutzerzahlen zu erreichen. Die jugendlichen Nutzer von heute, die vor allem Prepaid-Handys haben, sollen nicht nur neue mediale Offerten nutzen, so sollen auch die Vertragsnutzer von morgen sein und die (noch zu schaffenden) Dienste der Zukunft in Anspruch nehmen. Es ist allerdings noch keineswegs klar, was sich aus den Erkenntnissen der gegenwärtigen SMS-Nutzung ableiten lässt und welchem Wandel diese, erst recht eingedenk einer raschen medialen Entwicklung, unterliegt. Schiere Extrapolationen haben sich immer schon als problematisch erwiesen, denn die Aneignung eines Mediums und medialer Angebote ist ein Prozess, der, schon aufgrund der Eigensinnigkeit der Nutzer, viele Fragen offen lässt.

5. Literatur

Burkart, Günter: Mobile Kommunikation. Zur Kulturbedeutung des "Handy". In: Soziale Welt, 5, 2000, S. 209-232.

Freyermuth, Gundolf S.: Ausgebimmelt, abgebrabbelt! In: NZZ FOLIO. Die Zeitschrift der Neuen Züricher Zeitung. September 1999. URL: www-x.nzz.ch/folio/archiv/1999/09/articles/freyermutz.htm (22.02.01).

Dimmick, John W./Sikand, Jaspreet/Patterson, Scott, J. (1994): The Gratifications of the Household Telephone. Sociability, Instrumentality and Reassurance. In: Communication Research, 21, S. 643-663.

Flanagin, Andrew/Metzger, Miriam J.: Internet Use in the Contemporary Media Environment. In: Human Communication Research, 27, 2001, S. 153-181.

Fritzsche, Yvonne: Modernes Leben: Gewandelt, vernetzt und verkabelt. In: Deutsche Shell (Hrsg.): Jugend 2000. Bd. 1, Opladen 2000, S. 349-378.

Höflich, Joachim R.: Telefon: Medienwege - Von der einseitigen Kommunikation zur mediatisierten und medial konstruierten Beziehung. In: Faßler, Manfred/Halbach, Wulf R. (Hrsg.): Geschichte der Medien. München 1998, S. 187-225.

Jochmann, Ludger: SMS. Sprüche, Tipps und Tricks. Frankfurt/Main 2000.

Klemann, Roland: UMTS - von der Krise zur Chance. In: DIE WELT online, 02.05.2001. URL: www.welt.de/daten/2001/05/02/0502wfo250766.htx (02.05.01).

Leung, Louis/Wei, Ran: More than just Talk on the Move: Uses and Gratifications of the Cellular Phone. In: Journalism & Mass Communication Quarterly, 77, 2000, S. 308-320.

Ling, Richard: "One can talk about common manners!" The Use of the Mobile Telephones in Inappropriate Situations. In: Haddon, Leslie (Hrsg.): Communications on the Move: The Experience of Mobile Telephony in the 1990s. COST 248. The Future European Telecommunications User Mobile Workgroup. University of Sussex. Brighton, August 1997, S. 73-96. Online verfügbar unter URL: web.cnlab.ch/cost248 (21.01.01)

Negroponte, Nicholas: Total digital. Die Welt zwischen 0 und 1 oder die Zukunft der Kommunikation. München 1971.

O.N.: Zahl der Handy-Besitzer steigt auf 700 Millionen. In: Die Welt online, 10.01.2001a. URL: www.welt.de/daten/2002/01/10/0110wi215651.hax (18.01.01).

O.N.: Kurze Nachricht ganz Groß. In: Fokus Online vom 13.02.01b. URL: www.focus.de/G/GW/GWA/gea.thm?snr=84268&streamne=8 (13.02.01).

O'Keefe, ‚Garrat J./Sulanowski, Barbara K.: More than just Talk: Uses and Gratifications, and the Telephone. In: Journalism & Mass Communication Quarterly, 72, 1995, S. 922-933.

Schenk, Michael: Medienwirkungsforschung. Tübingen 1987.

Weiler, Stefan: Die neue Mediengeneration. Medienbiographien als medienpädagogische Prognoseinstrumente. Eine empirische Studie über die Entwicklung von Medienpräferenzen. München 1999.

Anmerkung: Eine detaillierte Darstellung der Studie erscheint unter dem Titel "Mobile schrifliche Kommunikation - oder: E-Mail für das Handy. Die Bedeutung elektronischer Kurznachrichten (Short Message Service) am Beispiel jugendlicher Handynutzer" in der Ausgabe 4/2001 der Zetschrift "Medien- & Kommunikationswissenschaft".


Hofmann, Olaf ; Wiegand, Erich Institution: Arbeitskreis Qualitätssicherung und Qualitätsstandards in der Onlineforschung der DGOF e.V., Hürth
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Qualitätssicherung in der Online-Forschung – Ergebnisse des Arbeitskreises der DGOF."


Hoppe, Michael ; Institution: Ipsos Deutschland GmbH, Hamburg
Article (version: 25/06/2002 - 07:47, size: 19700)
"Die Qualität von Online Panels – ein Methodentest."
German:

Die Qualität von Online Panel - Ein Methodentest

Online-Marktforschung gilt als zukunftsweisend. Durch das Medium Internet können auch spezielle Zielgruppen schnell und kostengünstig angesprochen werden. Stand bisher die Erforschung der Internet-Nutzer und die Überprüfung der Internetauftritte selbst im Vordergrund, so steigt zunehmend das Interesse, das Medium auch für Themen zu nutzen, die nicht in unmittelbarem Zusammenhang mit dem Internet stehen. Insbesondere Online-Panel bieten sich hier als Rekrutierungsmöglichkeit für Befragte an. Gerade die Online-Panel unterliegen jedoch häufig der Kritik einer mangelnden Repräsentativität und einer schwer nachvollziehbaren Art der Rekrutierung. Sie werden daher teilweise entweder abgelehnt oder mit großer Zurückhaltung betrachtet.

Online- oder Offline-Rekrutierung? - Das ist hier die Frage
Internet-Nutzer können auf ganz unterschiedlichen Wegen rekrutiert und befragt werden: Mittels klassischer offline Methoden (face-to-face, per Telefon, postalisch) oder auch mit den neuen Möglichkeiten der Online-Rekrutierung und Online-Fragebogen. Sie lassen sich entweder durch repräsentative Zufallsauswahl ad hoc, oder gemäß repräsentativer Strukturvorgaben für Online-Access-Panel gewinnen. Für die Rekrutierung stehen eine Reihe von Fragen zur Qualität des methodischen Vorgehens zur Diskussion:
Erreichen wir mit den unterschiedlichen Rekrutierungs- und Befragungsarten (online oder offline) unterschiedliche Internetnutzer, und wie wirkt sich die Rekrutierungs- und Befragungsart auf die Ergebnisse aus?

Die Studie
Um der Beantwortung dieser Fragen ein Stück näher zu kommen, führte Ipsos Deutschland im November/Dezember 2000 in Zusammenarbeit mit Langnese/Unilever eine vergleichende Untersuchung zur Überprüfung der Validität von Online-Panel-Befragungen durch. In fünf unabhängig voneinander durchgeführten Befragungen von insgesamt 1738 Internet-Nutzern wurden sowohl Internetnutzugskriterien als auch die Einstellungen zur Eismarke "Magnum" erhoben. Entscheidend dabei war die unterschiedliche Rekrutierung und Befragungsart der Gruppen: Neben einer bevölkerungsrepräsentativen face-to-face Umfrage mit dem Ipsos CAPI-Bus wurden vier Panel (drei Online- und ein Offline-Panel) eingesetzt, die sich hinsichtlich Rekrutierungsform und Befragungsart unterschieden (siehe Tabelle 1).

Aus den drei Online-Paneln wurden die Teilnehmer jeweils nach den im Rahmen einer repräsentativen Voruntersuchung ermittelten Quoten (Alter, Geschlecht, Bildungsstand und Ortsgröße) ausgewählt und mit einem Online-Fragebogen befragt.
Die Rekrutierung für das erste Online-Panel erfolgte telefonisch (CATI), für das zweite Online-Panel  über Banner, Anzeigen etc. Die Teilnehmer des dritten Online-Panel wurden aus dem Ipsos Access Panel, einem etablierten Offline-Haushaltspanel mit über 70.000 Teilnehmern, rekrutiert. Aus diesem Panel stammt auch die vierte Gruppe von Panel-Teilnehmern, die allerdings offline postalisch befragt wurde.
In allen fünf Stichproben befragte Ipsos die Internet-Nutzer in der deutschen Wohnbevölkerung zwischen 14 und 69 Jahren dar. Aufgrund der Zielsetzung wurde hier der  "Internet-Nutzer" definiert als "eine Person, die zumindest zu Hause Zugriff auf das Internet hat und zumindest gelegentlich das Internet zu Hause nutzt."

Untersuchungsinhalte
Die Fragebögen waren für die fünf Gruppen in Reihenfolge, Formulierung und Umfang identisch. Hauptbestandteil der Befragung waren die Brand Image Fragen zur Eismarke "Magnum". Brand Image ist Bestandteil von Brand Evolution, dem Ipsos- Instrument für die erfolgreiche Markenführung mit den Dimensionen:  Power (= Charakter, Relevanz) und Prominence (= Ansehen, Vertrautheit) einer Marke. Hieraus ergeben sich eindeutige Hinweise auf die Positionierung (Brand Health) einer Marke im Vergleich zum Wettbewerb. Zum Fragenkatalog des Ipsos Brand Evolution gehörten in diesem Fall
· die Anzahl gekaufter Eismarken der letzten 12 Monate
· Markenbekanntheit
· zukünftige Kaufabsichten
· Spontane Assoziationen zu Magnum (offene Frage)
· Image-Items
· Generelle Akzeptanz von Magnum
Des weiteren wurden Daten zur Internet-Nutzung und die Sozio-Demographie der Befragten erhoben.
Wie für Online-Befragungen üblich, wurde ein Incentive für die Teilnahme an den Interviews vergeben, wohingegen die beiden offline befragten Gruppen kein Incentive erhielten.

Ergebnisse

Wie vermutet, spiegeln sich die Unterschiede sowohl der Rekrutierungs- als auch der Befragungsart z. T. signifikant, z. T. nur tendenziell in den Ergebnissen wider. Unterschiede der Gruppen zeigen sich dabei sowohl bezüglich der Soziodemographie und Internet-Nutzung als auch in der Beantwortung der Brand-Image-Fragen.

Soziodemographische Variablen
Alter, Geschlecht, Bildung und pol. Ortsgröße waren durch die Quoten vorgegeben. Zusätzlich erfragt wurden die Variablen Familienstand, Berufstätigkeit, HH-Größe und HH-Netto-Einkommen (siehe Tabelle 2).

Diesbezüglich sind sich das per CATI und das online rekrutierte Online Panel (Gruppe 2 und 3) größtenteils ähnlich, wobei die Trends in Gruppe 3 etwas stärker ausgeprägt sind: Die befragte Person ist weniger häufig verheiratet, in kleineren Haushalten, eher berufstätig und mit geringerem Einkommen.
Die offline befragte Gruppe des Ipsos Access Panels (Gruppe 5) unterscheidet sich hiervon am stärksten: Es handelt sich häufiger um Verheiratete mit Kindern, größerem Haushalt und einem höheren Haushaltseinkommen, mehr einfache bis mittlere Angestellte und Hausfrauen sind vertreten.

Internet-Nutzung der Befragten

Auch bezüglich der Internet-Nutzung zeigen sich in den fünf Gruppen tendenziell bis signifikant unterschiedliche "User-Typen" (siehe Tabelle 3)

Die Online-Panel-Teilnehmer (Gruppen 2,3,4) zeichnen sich, unabhängig von der  Art der Rekrutierung, gegenüber den anderen Gruppen durch deutlich häufigere Internet Nutzung aus. Insbesondere im passiv online (über Banner) rekrutierten Online-Panel mit geringerem Einkommen befinden sich die "Heavy User", die neben T-Online verstärkt über Compuserve und andere günstige und insgesamt auch mehr Provider surfen. Die face-to-face per CAPI Befragten sind eher als Internet-Neulinge zu bezeichnen und nutzen, neben T-Online tendenziell stärker AOL. Diese Gruppe ist auch eher nur zuhause im Netz, wohingegen die Internet-Nutzung am Arbeitsplatz und anderen Orten für die übrigen Gruppen auch eine wichtige Rolle spielt. Beide offline befragten Gruppen (1+5) zeichnen sich durch eine vergleichsweise geringere Nutzungshäufigkeit aus.

Variablen zum Brand Image
Die Unterschiede der Gruppen bei der Soziostruktur und Internet-Nutzung spiegeln sich auch in den Antworten zum Brand Image der Eismarke Magnum wider (siehe Chart 1).

Die Ergebnisse der drei per WWW-Fragebogen befragten Online-Gruppen sind sehr ähnlich.  Sie äußern sich teilweise kritischer als offline-Befragte, was insbesondere bei den Imagewertungen deutlich wird. Bei den Ipsos-CAPI-Bus-Befragten werden zwar zur Eismarke Magnum insgesamt weniger spontane positive wie negative Assoziationen geäußert, die Bewertung der Image-Items fällt jedoch im Vergleich zu den Online-Panel-Gruppen größtenteils positiver aus.

Und geradezu euphorisch äußern sich die postalisch befragten Ipsos-Access Panelisten, die bezüglich der Eismarken-Images 6 von 10 Items z. T. deutlich höher bis signifikant besser bewerten als andere Gruppen und auch bei den spontanen Assoziationen zu Magnum insgesamt deutlich mehr Antworten geben.
Die ähnliche Bewertung des Images von Magnum durch die drei online erhobenen Gruppen spiegelt sich auch in der Brand Health Map wider (Chart 2).

Alle online befragten Panelisten  bewerten die Marke in allen drei Dimensionen erheblich weniger positiv, lediglich die Teilnehmer des online rekrutierten Panels bewerten das Image von Magnum tendenziell positiver hinsichtlich der Dimension Power.
Für die Gruppe Ipsos-CAPI-Bus weist Magnum die gleiche Prominence, jedoch eine deutlich stärkere Power und ein positiveres Preis-Leitungsverhältnis auf als für die drei online erhobenen Gruppen. Dagegen geben die per schriftlichen Fragebogen Befragten des Ipsos Access Panels deutlich bessere Werte in den beiden Dimensionen Power und Prominence.
Bei der Betrachtung der Brand Commitment Scale (siehe Tabelle 4), die die Anteile vom überzeugten Nicht-Käufer bis zum sicheren Käufer einer Marke darstellt, zeigt sich eine relativ ähnliche Käuferstruktur bei den offline (face- to face und postalisch) erhobenen Gruppen.

Bemerkenswert ist die Erkenntnis, dass in den 5 Gruppen Magnum zwar unterschiedlich positioniert wird, im Vergleich zu anderen Marken (hier nur Cornetto dargestellt, siehe Chart 3) aber immer hinsichtlich Power und Prominence überlegen, hinsichtlich des Preis-Leistungsverhältnisses unterlegen ist.
Wie auch immer also rekrutiert und befragt wird: Die relative Position der Marken zueinander bleibt von diesen Einflussfaktoren nahezu unberührt.


Diskussionen und Schlussfolgerungen
Die hier vorgestellte Untersuchung hat einige Ergebnisse früherer Forschungen bestätigt und einige neue erbracht. Die Analyse des zum Teil signifikant unterschiedlichen Antwortverhaltens zeigt, dass sowohl die Rekrutierungs- als auch die  Datenerhebungsmethode einen deutlichen Einfluss auf die Ergebnisse haben kann. Die Untersuchung macht auch deutlich, dass es derzeit keine eindeutige "goldene Regel" für die Erforschung der Internet-Nutzer und Befragungen im Netz gibt. Weitere Studien wie diese mit einer methodenbezogenen Ausrichtung sind notwendig, um die Qualität von Online-Untersuchungen besser beurteilen zu können. Folgende Erkenntnisse können schon jetzt festgehalten werden:

Ø Eine unterschiedliche Befragungsart erreicht unterschiedliche Zielgruppen im Internet.
Unsere Studie zeigt deutlich das unterschiedliche Antwortverhalten aufgrund der Erhebungsmethode (Online vs. offline).  Mit der reinen Offline Ansprache spricht man offenbar primär die leicht zu Hause erreichbare, ggf. auch etwas "bodenständigere" Bevölkerung an, online lassen sich hingegen auch heavy-user, die sich vermutlich durch mehr Mobilität und einen flexibleren Lebenswandel auszeichnen, antreffen.
Allerdings muss man wissen, dass man hiermit auch Haushalte mit anderer Demographie (kleinere Haushalte, geringeres Einkommen) anspricht.

Ø Die Rekrutierung von einem Offline-Panel kann den Effekt der Erhebungsmethode etwas mindern.
Ein Vergleich des Ipsos Online-Panel bzgl. Internetnutzung zeigt natürlicherweise zum einen eine gewisse Annäherung an die Daten vom Ipsos Offline-Panel (da aus der gleichen Grundgesamtheit rekrutiert), aber andererseits liegen die Werte teilweise auch näher an dem "repräsentativen" CAPIBUS face-to-face-Ergebnissen, insbesondere in bezug auf Haushaltsgröße, Familienstatus und Einkommen, aber auch bezgl. der Häufigkeit der Nutzung des Netzes.
Andererseits reagieren die Ipsos-Onliner bei der Imagebeurteilung wie auch der Brand Health Map ähnlich den anderen Online-Paneln.
Eindeutig ist die Tatsache, dass sich bei den verschiedenen Online- und Offline-Gruppen zum Teil signifikante Unterschiede in der Demographie und der Internetnutzung ergeben, und dass dies u.a. auch einen Einfluss auf die Ergebnisse von Befragungen haben kann.
Das heißt, man muss, um möglichst nahe an ein "repräsentatives" Abbild der Internetnutzer zu kommen, diese Kriterien mit berücksichtigen. Da es in der Regel nicht oder nur schwer möglich ist, alle Kriterien bei der Quotierung mehrerer strukturgleicher Gruppen zu berücksichtigen, sollten zumindest die offensichtlichen stark unterschiedlichen Merkmale Haushaltsgröße, Einkommen (beide korrelieren wiederum mit dem Familienstand) und Häufigkeit ebenso wie Beginn der Internetnutzung mit zur Gewichtung herangezogen werden.
Momentan gibt es allerdings noch keine allgemein anerkannte Erhebung, anhand derer man "richtig" gewichten könnte. Für diese Untersuchung haben wir zur Gewichtung den repräsentativen Ipsos CAPIBUS herangezogen, der wöchentlich die neuesten Nutzerdaten face-to-face erhebt.
Bei den Ergebnissen zu berücksichtigen ist auch die Befragungssituation: Während die online und postalisch Befragten die Möglichkeit hatten, den Fragebogen zu einem persönlich genehmen Zeitpunkt auszufüllen, waren die face-to-face-Befragten CAPI-Bus Teilnehmer einem gewissen Zeitdruck und der Anwesenheit eines Interviewers ausgesetzt. Die Unterschiede dieser Gruppe zu den anderen bei den Ergebnissen zum Brand Image sind sicherlich u. a. dadurch zu erklären. Der Effekt der CAPI-Erhebungsmethode kann jedoch mit dem Design dieser Studie nicht beantwortet werden, da eine kontrollierte Variation der Erhebungsmethode über die Gruppen nicht vorgenommen wurde.
Neben diesen geschilderten Unterschieden bezüglich Befragungsart und Paneleinbindung sind natürlich die Unterschiede zwischen den drei Online Paneln interessant.

Ø Bei reinen Online-Befragungen übt ausschließlich die Art der Rekrutierung einen Einfluß auf die Ergebnisse aus, da die Erhebungsmethode identisch ist.
Zwar zeigt sich eine auffallende Ähnlichkeit der drei Gruppen hinsichtlich der meisten Ergebnisse, das banner-rekrutierte Online-Panel weist jedoch Unterschiede bzw. stärker ausgeprägte Tendenzen zu den beiden anderen Online-Panel auf. Insbesondere die positivere Markenbewertung ist hier auffallend. Die Tatsache, dass sich diese Gruppe durch die besonders häufige Internet-Nutzung über zum Teil günstigere und mehr Anbieter und ein relativ geringeres Einkommen der Befragten auszeichnet, lässt die Vermutung aufkommen, dass die Teilnehmer aus diesem Panel nicht zuletzt an dem Incentive interessiert sind und rechtfertigt das Misstrauen gegenüber einer nicht nachvollziehbaren Online-Rekrutierung. Verstärkt wird dieses Misstrauen dadurch, dass auf Websites wie kostenlos.de oder schnaeppchen.de u.a. auf die Teilnahme an Online Panel Marktforschung von mehr als 10 Instituten als Einnahmequelle hingewiesen wird
Ein weiteres, grundlegenderes Ergebnis dieser Studie ist die Erkenntnis,

Ø daß sich die Zielgruppe der Internet-Nutzer gegenwärtig nur mit Einschränkungen repräsentativ erforschen lässt.
 
Die in dieser Studie variierten Einflussfaktoren wie Auswahlverfahren, Rekrutierungsform und Erhebungsinstrument führen zu feststellbaren Unterschieden der Ergebnisse, aus denen sich eine „Wahrheit“ nur durch willkürlich erscheinende Setzung erreichen ließe. Zusätzliche Einflussfaktoren sind durch die Art der Incentives und weitere, hier nicht berücksichtigte Faktoren, z.B. bereits erfolgte Käufe im Internet, zu erwarten. Dieser Befund ist allerdings weniger dramatisch und überraschend, als es vielleicht den Anschein hat. Denn tatsächlich repräsentative Ergebnisse lassen sich streng genommen nur für eine bekannte und erreichbare Grundgesamtheit erreichen. Diese Voraussetzung ist für die Internet-Nutzer jedoch nicht gegeben. Denn zum einen ist die Definition eines Internet-Nutzers nicht eindeutig geklärt, zum anderen sind die relevanten Strukturmerkmale dieser Gruppe nicht gesichert. Als weiterer Faktor ist die rasante Dynamik der Internetnutzung zu berücksichtigen, die mit der Beschreibung „moving target“ treffend umschrieben werden kann.

Eine neue Definition von Qualität
Wie eingangs erwähnt, stützt sich die Beurteilung der Qualität von Marktforschung meist auf die Forderung der Repräsentativität, der Annäherung des Ergebnisses an einen „wahren“ Wert. Eine solche „Wahrheit“ existiert natürlich für das breite Spektrum der Internet-User, aber  - und das zeigt unsere Studie – die Ergebnisse sind durch unterschiedliche Rekrutierungs- und Erhebungsmethoden verzerrt. Zu dynamisch ist die Entwicklung, zu sensibel reagieren die Ergebnisse auf feine Veränderungen der Rekrutierungs- und Erhebungsmethoden ebenso wie vermutlich auch die Art und Höhe der Incentivierung. Das Kriterium der Qualität muss daher offensichtlich anders definiert werden.

Ein Ergebnis dieser Studie ist, dass die methodische Vorgehensweise für den Kunden nachvollziehbar sein muss, wie es auch in Deutschland vom ADM nachhaltig gefordert  und von den ADM-Instituten angewendet wird. Außerdem sollte bei der Frage nach der Qualität vor allem das Interesse des Auftraggebers im Vordergrund stehen: Qualität ist schließlich kein Selbstzweck sondern eine unabdingbare Voraussetzung seriöser Marktforschung. Wenn sich nun zwar noch keine „Wahrheit“ feststellen lässt, so sollte der Kunde jedoch zumindest die ungeschminkte Information fordern: zum einen, welche Auswirkungen die unterschiedlichen Rekrutierungs- und Erhebungsmethoden auf die Ergebnisse haben können und welche Internet-Nutzer über welche Medien am besten erreicht werden können, zum anderen muss dem Kunden volle Transparenz bzgl. folgender Kriterien angeboten werden:

Ø Rekrutierung
Ø Kriterien der Teilnahme
Ø Schutz gegen mehrfaches Anmelden
Ø Zusatzinformationen hinsichtlich der Panelteilnehmer
Ø Plausibilitätskontrollen
Ø Erhebungsmethode
Ø Nicht-Beantwortung von Fragen
Ø Vergütung
Ø Gewichtung

und vielleicht auch manchmal darauf hingewiesen werden, dass nicht alle Arten von Befragungen online möglich sind.


Horstmann, Gernot ; Institution: Fakultät für Psychologie und Sportwissenschaft, Universität Bielefeld
Article (version: 25/06/2002 - 07:47, size: 7086)
"Einschätzungen von Typikalität und Häufigkeit eines mimischen Ausdrucks."
German:

Judgements of Typicality and Frequency of Facial Expressions of Emotion

Gernot Horstmann

University of Bielefeld, Germany

OBJECTIVE

The study of facial expressions has a long tradition within psychology. In this tradition (e.g. Darwin, 1965; Ekman, 1972), certain facial expressions have been widely regarded as prototypical displays of a few basic emotions, in particular of happiness, sadness, fear, anger, disgust, and surprise. However, critics (i.e. Fridlund, 1994; Russell, 1994) have contended that the proposed prototypes, which are typically quite intense expressions, are (a) exaggerated and may (b) occur only infrequently in everyday life.

Presumably, those critics implicitly assume that emotional expressions are common taxonomic categories, where the prototype represents a central tendency and is encountered frequently. However, expressions may be variants of goal-derived categories (Barsalou, 1985), where the prototype represents an ideal, which often is an extreme value.

The aim of the study was twofold. The first aim was to empirically assess the relationship between judged typicality and judged frequency of occurrence. The second aim was to find out what determines judged typicality, following a procedure used by Barsalou (1985).

METHOD

Participants

85 participants (age: M= 27.9, SD= 10.6 yrs., gender: 23 men, 56 women, 6 reported no gender) completed the study. The experiment was freely accessible from the internet. Most of them, however, probably responded to flyers that were distributed on the university campus.

Design.

36 participants rated the typicality, and 33 participants rated the frequency of occurrence of facial expressions. 16 additional participants rated the ideal of a clear communication of emotion.

Stimuli

5 sets of stimuli were used, one set for each emotion (anger, disgust, happiness, sadness and surprise). Each set consisted of 5 stimuli: one neutral face, one full expression according to the criteria of Ekman and Friesen (1975), and three faces that were linear extrapolations between the neutral and the full face (see, for example, Figure 1). The stimuli were computer-generated line-drawings published by Musterle and Rossler (1986).
 
Figure 1. Screenshot from the experiment.

Procedure and Materials

The experiment was controlled by a CGI-script written in PERL, and the materials were displayed via the internet browser as a HTML document. After reading the general instruction and reporting age and gender, each participant completed five pages, each of which was headed by the emotion name and contained the corresponding stimulus set. For each face, a judgement had to be made with HTML-style radio-buttons forming a five-point rating scale (see Figure 1).

The order of the emotions within the five screen pages was varied randomly between participants. When the participants submitted the data, the PERL script checked for completeness of the data. If the data were incomplete, the same page was sent back to the participant. If the data were complete, the next page was presented until all five pages had been completed.
 

RESULTS

As can be seen in Figure 2, the typicality and the ideal ratings are nearly perfectly linearly related to expression intensity. In contrast, the frequency of occurrence showed an inverted-U shaped relationship to intensity.
Figure 2. Mean typicality, frequency and ideal ratings for each of the five intensities of each of the five emotions.


Table 1 shows the first order correlations between the three judgements, the intensity of the expressions, and the CT-score representing proximity to central tendency. The CT score was 1 for the neutral and the full face, 3 for the face with medium intensity, and 2 for the remaining two faces.

Further analysis paralleled that of Barsalou (1985) and was intended to determine which variable – central tendency, ideal, or frequency of instantiation – predicts the judgement of typicality best. It focussed therefore on the partial correlations between typicality and the other variables. Table 2 shows the partial correlations between typicality and each of the other variables, statistically controlling for the influence of the remaining variables.


 

CONCLUSION

The data further support the assumption that the prototype of diverse categories of facial expressions of emotion is an intense, "full" facial expression. The novel finding that rated typicality is linearly related to the intensity of the expression, is in full accord with this assumption. Furthermore, the results support the notion that these full faces are not necessarily those that are most often displayed in everyday life when people experience an emotion. Third, when asked how good a given expression is suited to express the corresponding emotion, the ratings were again linearly related to the intensity of the expression. This corroborates the notion that the function of emotional expressions is the communication of emotion.

As to the second aim of the study, the data show that judged typicality is predominantly related to the ideal of emotion communication, and only to a moderate degree to frequency of occurrence (88% vs. 17% of unique explained variance). The unique variance explained by central tendency was nearly zero. These results suggest that facial expressions are not common taxonomic categories, but a variant of an ideal-based goal-derived category.
 

References


Barsalou, L. W. (1985). Ideals, central tendency, and frequency of instantiation as determinants of graded structure in categories. Journal of Experimental Psychology: Learning, Memory, and Cognition, 11, 629-654.
Darwin, C. (1965). The expression of the emotions in man and animals. Chicago: Chicago University Press (Original work published 1872).
Ekman, P. (1972). Universals and cultural differences in facial expressions of emotion. In J. Cole (Ed.), Nebraska Symposium on Motivation (Vol. 19, pp. 207-283). Lincoln: University of Nebraska Press.
Ekman, P., & Friesen, W. V. (1975). Unmasking the face: A guide to recognizing emotions from facial clues. Englewood Cliffs, NJ: Prentice-Hall.
Fridlund, A. J. (1994). Human facial expression: An evolutionary view. San Diego: Academic Press.
Musterle, W. & Rossler, O. E. (1986). Computer faces: The human Lorenz matrix. BioSystems, 19, 61-80.
Russell, J. A. (1994) Is there universal recognition of emotion from facial expression? A review of the cross-cultural studies? Psychological Bulletin, 115, 102-141.
 

Note

If you like to contact me, please send a mail to gernot.horstmann@uni-bielefeld.de
 
 


Jaekel, Michael ; Uhlitzsch, Manuel ; Wilkens, Rainer Institution: INRA Deutschland GmbH, Mölln, WEB. DE AG, update GmbH
Article (version: 25/06/2002 - 07:47, size: 21784)
"Forschung mit dem Internet über das Internet: Positionierung von E-Mail im Wettbewerb mit anderen Kommunikationsmedien."
German:

Forschung mit dem Internet über das Internet:
Positionierung von E-Mail im Wettbewerb mit anderen Kommunikationsmedien



1        Hintergrund und Zielsetzung

E-Mail und andere neue Kommunikationsmedien haben unsere Möglichkeiten zur Kommunikation erheblich erweitert. Die neue Vielfalt ist von hoher Relevanz für Alltag und Wirtschaft:
  • Unsere Alltagskommunikation ist einem tiefgreifenden Wandel unterworfen. Der Südamerikaner aus derselben Newsgroup kann mittlerweile "näher" sein als der Nachbar "von gegenüber".
  • Die Anbieter von Kommunikationsmedien und -produkten stehen in einem intensiven Wettbewerb: WEB.DE konkurriert mit Yahoo!, und beide wiederum konkurrieren mit der Deutschen Telekom, der Deutschen Post Worldnet etc..
Zielsetzung der Studie ist die Bestimmung der Ist-Positionierung von E-Mail im Wettbewerbsumfeld hinsichtlich verhaltensrelevanter Kriterien. Entsprechend dieser Zielsetzung lauten die beiden zentralen Fragestellungen:
  • Einflussfaktoren:
    Welche Personen nutzen in welchen Situationen welche Kommunikationsmedien?
            – Welche Einflussfaktoren sind relevant, welche nicht?
            – Welche Rolle spielen personale und situative Einflussfaktoren?

  • Positionierung:
    Wie positioniert sich E-Mail im Wettbewerb mit anderen Kommunikationsmedien?
             – Welche Medien konkurrieren mit E-Mail, welche sind eher komplementär?
             – Welches sind die spezifischen Stärken und Schwächen von E-Mail?

Die Ist-Positionierung bildet eine wichtige Informationsgrundlage für die Entwicklung von

  • Optionen für eine tragfähige Soll-Positionierung von E-Mail und
  • erfolgversprechenden Produkten und Werbemitteln.


2       Untersuchungsanlage


2.1    Erhebungsmethode und Sampling

Die Erhebung erfolgte als internetbasierte Online-Befragung. Die Stichprobe umfasste n=1.000 Internet-Nutzer in Privathaushalten in Deutschland ab 14 Jahren, die im Zeitraum vom 29.09.2000 bis 10.10.2000 interviewt wurden.

Die Studie wurde im inr@quest-Panel durchgeführt, dem Online-Panel von INRA Deutschland. Das Sampling erfolgte nach anerkannten Verfahren der Zufallsauswahl:

  1. Zufallsauswahl der inr@quest-Panelisten in bevölkerungsrepräsentativen Studien (offline)
  2. Zufallsauswahl der Befragungsteilnehmer im inr@quest-Panel
Die Daten wurden entsprechend aktuellen Strukturzählungen aus den INRA-Mehrthemenumfragen gewichtet.

Dieses Sampling erzielt das Maximum an Repräsentativität für private Internet-Nutzer, das heute in der Online-Marktforschung möglich ist. Der Arbeitskreis Deutscher Markt- und Sozialforschungsinstitute e.V. und andere Verbände empfehlen deshalb dieses Vorgehen, um Repräsentativität für Internet-Nutzer zu erreichen (ADM, ASI, BVM und D.G.O.F 2001).

Das inr@quest-Panel unterscheidet sich deutlich von jenen Panels,
  • die "passiv" rekrutiert sind ("Selbstrekrutierung"), was einer elementaren methodischen Anforderung an die Stichprobenziehung nicht genügt: Das durchführende Institut muss das Auswahlverfahren eindeutig definieren. Ansonsten sind (unkontrollierte) Verzerrungen der Stichprobe zu erwarten.
  • die online rekrutiert sind, was mit hoher Wahrscheinlichkeit dazu führt, dass Intensiv-Nutzern des Mediums Internet überproportional vertreten sind.
Dementsprechend sind in der Stichprobe dieser Studie auch Nicht-Intensiv-Nutzer des Mediums Internet angemessen vertreten.


2.2     Erklärungsmodelle und Operationalisierung der Variablen

Welche Personen nutzen in welchen Situationen welche Kommunikationsmedien? Um diese zentrale Fragestellung zu beantworten, wurden drei Erklärungsmodelle entwickelt (s. Abb. 1).

Zur Erklärung der Mediennutzung wurden drei Modelle entwickelt, die personale und situative Einflussfaktoren berücksichtigen.


Modell A (Nutzungshäufigkeit)

Die Nutzung der Kommunikationsmedien wird als aktive Nutzungshäufigkeit gemessen. Hierzu gaben die Befragten an, wie häufig sie in einer "typischen Woche" die verschiedenen Medien nutzen (Anzahl gesendeter E-Mails, Faxe etc.).
Dieses Modell berücksichtigt folgende Einflussfaktoren:
  • Kommunikationsmedium
    E-Mail / Telefon / persönliches Gespräch / Fax / SMS / Brief / Postkarte.
  • Soziodemographie
    Alter, Geschlecht, Schulbildung, Berufstätigkeit.
  • Persönlichkeit
    Introversion / Extraversion, Gemütsruhe / Enthusiasmus sowie Technikaffinität / Nicht-Technikaffinität, basierend auf Auszügen aus dem 16pf-Inventar (Schneewind, Schröder, Cattell 1986).
  • Involvement (medienspezifisch):
    Kognitives Involvement (Items "wichtig" und "essenziell") und emotionales Involvement (Items "faszinierend" und "reizvoll"), entsprechend dem zweidimensionalen Produktinvolvement-Konzept von Zaichkowski (1987).
  • Situation:
    Welche Situationen die Befragten in einer "typischen Woche" erleben, konnte in dieser Befragung nicht erfasst werden. Deshalb wurden im Interview Situationen vorgegeben, die in den Modellen B und C als Einflussfaktoren berücksichtigt werden.

Modell B (Nutzungspräferenz in allgemeinen Situationen)

Im Interview werden allgemein charakterisierte Situationen vorgegeben und die Nutzungspräferenz erhoben (Abb. 2 links zeigt ein Beispiel).
Die Situationsbeschreibungen variierten hinsichtlich der geforderten Reaktionszeit, der Bekanntheit des Empfängers, der erwarteten emotionalen Reaktion, der Formalität der Mitteilung sowie dem Zeitpunkt. Pro Interview wurden 6 aus 72 Situationen zufällig ausgewählt und sukzessive vorgegeben.
Hinsichtlich der anderen Einflussfaktoren sind die Modelle B und A identisch.

Modell C (Nutzungspräferenz in konkreten Situationen)

Unter Vorgabe konkret beschriebener Situationen wird die Nutzungspräferenz analog Modell B gemessen.
Insgesamt wurden 28 verschiedene Situationen aus dem privatem und dem beruflichen Bereich konkret beschrieben; pro Interview wurden 6 Situationen zufällig ausgewählt und sukzessive vorgegeben (Abb. 2 rechts zeigt ein Beispiel).
Aufgrund der Vielzahl von Situationen erfolgte keine varianzanalytische Auswertung. Die Positionierung der Medien in konkreten Situationen wurde mit einer Korrespondenzanalyse ermittelt (siehe Abschnitt 3.2).

Dieser Auszug aus dem Fragebogen zeigt die Erhebung der 1. Präferenz für ein Kommunikationsmedium in einer allgemein und in einer konkret beschriebenen Situation.


3        Ergebnisse


3.1    Einflussfaktoren der Nutzung von Kommunikationsmedien

Die erste zentrale Fragestellung lautete:

Welche Personen nutzen in welchen Situationen welche Kommunikationsmedien?

Die Nutzung eines Kommunikationsmedium (Modell A) bzw. die Präferenz (Modell B) kann jeweils zu ca. 44% varianzanalytisch erklärt werden – ein ausgesprochen guter Wert (s. Abb. 3).

Die errechnete Stärke der einzelnen Einflussfaktoren hängt maßgeblich davon ab, ob situative Einflüsse berücksichtigt werden (Modell B) oder nicht (Modell A):

  • Situation:
    Die Situation ist die mit Abstand wichtigste Einflussfaktorengruppe – sie erklärt in Modell B mehr Varianz als alle anderen Einflussfaktoren zusammen.
  • Soziodemographie und Persönlichkeit:
    Die Bedeutung personaler Einflussfaktoren nimmt in Modell B gegenüber Modell A geradezu dramatisch ab. Somit nutzen verschiedene Personen zwar unterschiedlich häufig verschiedene Kommunikationsmedien (Modell A), in derselben Situation fällt ihre Wahl jedoch ähnlich aus (Modell B).
  • Kommunikationsmedium:
    Die Art des Kommunikationsmediums ist ebenfalls weitaus weniger wichtig, wenn die Situation berücksichtigt wird. Bestimmte Medien werden also häufiger genutzt als andere, aber es gibt nur eine schwache situationsunabhängige Präferenz für bestimmte Medien.
  • Involvement:
    Das medienspezifische Involvement bleibt in Modell B gegenüber Modell A in etwa gleich bedeutend, mit einer Verschiebung vom kognitiven zum emotionalen Involvement.


Durch die Berücksichtigung situativer Merkmale (Modell B) schwindet der Einfluss personaler Merkmale. Das bedeutet: Die Situation prägt unmittelbar die Wahl des Kommunikationsmediums; personale Merkmale sind indirekt von Bedeutung.

Zwischenfazit

Die Wahl des Kommunikationsmediums wird entscheidend von der Situation geprägt, in der sich eine Person befindet. In einer gegebenen Situation ist der direkte Einfluss von Merkmalen der Person nur von untergeordneter Bedeutung. Da sich unterschiedliche Personen deutlich in ihrer Mediennutzung unterscheiden, existiert ein starker indirekter Einfluss personaler Merkmale.
Aus diesen Ergebnissen folgt:

  • Verschiedene Personen verhalten sich in derselben Situation ähnlich.
  • Aber: Bestimmte Personen befinden sich häufiger in bestimmten Situationen als andere.
  • Die Kausalkette lautet Person ® Situation ® Medium.


3.2    Positionierung von E-Mail im Wettbewerb

Die zweite zentrale Fragestellung lautete:

         Wie positioniert sich E-Mail im Wettbewerb mit anderen Kommunikationsmedien?

Da die Wahl des Kommunikationsmediums unmittelbar durch die Situation geprägt ist, muss eine verhaltensrelevante Positionierung an den situativen Stärken und Schwächen der Medien ansetzen. Diese wurden für allgemein charakterisierte Situationen (Modell B) und für konkret beschriebenen Situationen (Modell C) ermittelt.


3.2.1 Positionierung in allgemein charakterisierten Situationen

Als allgemeine Situationsmerkmale, die für das Verhalten und damit auch für die Positionierung am wichtigsten sind, wurden varianzanalytisch ermittelt (s. Abb. 3):

    1.  Zeitfaktor: Geforderte Reaktionszeit
    2.  Vertrautheit: Bekanntheit des Empfängers
    3.  Emotionalität: Erwartete emotionale Reaktion

Die Positionierung von E-Mail hinsichtlich dieser drei wichtigsten allgemeinen Situationsmerkmale (Modell B) wird durch eine Korrespondenzanalyse illustriert (s. Abb. 4).

Abgebildet sind die 6 Kommunikationsmedien und die 3 wichtigsten Dimensionen entsprechend dem Ergebnis der Varianzanalyse. Je näher ein Kommunikationsmedium an einer Situation positioniert ist, desto stärker die Präferenz für dieses Medium in dieser Situation.
Die Stärken von E-Mail liegen insbesondere in den Situationen, die keine sofortige Antwort erfordern und bei emotional unproblematischen Mitteilungen.

Situative Stärken und Schwächen der Medien

1. Geforderte Reaktionsgeschwindigkeit
In den Situationen, in denen eine Antwort "nicht unbedingt" oder erst "in den nächsten Tagen" erforderlich ist, hat E-Mail besondere Stärken. Dies gilt auch für Fax, Brief und Postkarte. Ist dagegen eine Echtzeit-Antwort erforderlich, werden das Telefon und das persönliche Gespräch bevorzugt. Die SMS wird hier als 'Zwitter' eingestuft (s. Abb. 4).

2. Bekanntheit des Empfängers
E-Mail wird etwas stärker präferiert, wenn der Empfänger "nicht gut bekannt" ist als wenn er "gut bekannt" ist – ähnlich dem Fax, dem Brief und der Postkarte. Die SMS gleicht hier dem Telefon sowie dem persönlichen Gespräch.

3. Erwartete emotionale Reaktion
Die Stärken von E-Mail liegen bei Mitteilungen, die "erfreulich" oder "weder erfreulich noch unerfreulich" sind, also emotional unproblematischen Angelegenheiten. Dies gilt erst recht für die SMS. Dagegen bleibt "Unerfreuliches" dem persönlichen Gespräch und dem Brief vorbehalten. Die anderen Medien – Telefon, Fax, Postkarte – zeigen sich hier indifferent.

Komplementarität und Konkurrenz

E-Mail ist derzeit zwischen Telefon, SMS, Postkarte und Fax positioniert; diese Medien sind die unmittelbaren Konkurrenten. Komplementär zu E-Mail sind das persönliche Gespräch und der Brief.


3.2.2 Positionierung in konkret beschriebenen Situationen

Die Positionierung von E-Mail hinsichtlich konkret beschriebener Kommunikations-Situationen (Modell C) wurde ebenfalls mit einer Korrespondenzanalyse ermittelt (s. Abb. 5).

Abgebildet sind die 6 Kommunikationsmedien und die 28 konkreten Situationen, nach inhaltlicher Ähnlichkeit zusammengefasst zu 6 Gruppen (I, II...). Je näher ein Kommunikationsmedium an einer Situation bzw. einer Situationen-Gruppe positioniert ist, desto stärker die Präferenz für dieses Medium.
Die besonderen Stärken von E-Mail liegen derzeit im formalen privaten Alltag (Situationen Gruppe I).

Situative Stärken und Schwächen der Medien

Die insgesamt 28 Situationen gruppieren sich nach formaler Ähnlichkeit (rechnerisches Ergebnis) und inhaltlicher Ähnlichkeit (gemeinsames Experten-Urteil) zu 6 Gruppen:

I Formaler privater Alltag
Alltägliche formale Angelegenheiten im privaten Bereich, wie
– ein Hotelzimmer reservieren,
– neue Anschrift der Bank mitteilen,
– etwas bei einem Versandhaus bestellen,
sind die besonderen Stärken von E-Mail, bei denen es mit dem Fax konkurriert.

II Formaler beruflicher Alltag
Bei formalen Angelegenheiten im beruflichen Bereich, die in der Kommunikation einen Beurkundungscharakter erfordern, wie
– ein Angebot abgeben,
– einen Treuerabatt gewähren,
werden Brief und Fax präferiert. In Frage kommt außerdem das (Verkaufs-)Gespräch.

III Existenzfragen
Bei elementaren und zutiefst emotionalen Angelegenheiten, wie
– einen Heiratsantrag machen,
– Beileid bei Trauerfall bekunden,
– von Vorgesetzten höheres Gehalt fordern,
wird das persönliche Gespräch oder ein Brief gewählt.

IV Problemsituationen
Bei problematischen Angelegenheiten, die negative emotionale Reaktionen erwarten lassen, wie
– einen Arzttermin verschieben,
– die Schwiegermutter ausladen,
– den "Urlaubsflirt" beenden,
wird das Telefon oder der persönliche Gespräch gewählt. Hier bietet eine synchrone Kommunikation den Vorteil, Negativreaktionen unmittelbar aufzufangen bzw. (emotionale) Probleme sofort zu lösen.

V Informaler privater Alltag
Informale Kommunikations-Situationen aus dem privaten Alltag, wie
– mit Freunden fürs Wochenende verabreden
– mit Freunden / Bekannten Neuigkeiten austauschen
– zum Geburtstag gratulieren
sind die Stärken von Telefon, SMS und des persönlichen Gespräches.

VI Traditionelle Postkartensituationen
In den beiden traditionellen Postkarten-Situationen
– den "Kunden ein frohes Weihnachtsfest wünschen",
– die "Liebsten aus dem Urlaub grüßen",
bleibt die Postkarte auch bei Internet-Nutzern das Medium der 1. Wahl; allerdings ziehen sie auch E-Mails in Betracht.

Konkurrenz und Komplementarität

Hinsichtlich der konkreten Situationen ergibt sich eine vergleichbare Positionierung wie hinsichtlich der allgemeinen Situationen: E-Mail ist zwischen Telefon, SMS, Postkarte und Fax positioniert, die Konstellation dieser Medien zueinander ist ebenfalls gleich. Persönliches Gespräch und Brief werden auch hier als komplementär zu E-Mail wahrgenommen.


4        Fazit

Kommen wir auf die beiden zentralen Fragestellungen zurück:

  • Welche Personen nutzen in welchen Situationen welche Kommunikationsmedien?
  • Wie positioniert sich E-Mail im Wettbewerb mit anderen Kommunikationsmedien?

Einflussfaktoren

Die Nutzung bzw. die Wahl des Kommunikationsmediums ist unmittelbar von der Situation geprägt. Personale Merkmale beeinflussen indirekt die Mediennutzung, indem sich verschiedene Personen unterschiedlich oft in verschiedenen Situationen befinden.

Positionierung

Die Ist-Positionierung von E-Mail lässt sich charakterisieren als Medium für alltägliche Geschäfte und Mitteilungen. Besondere Stärken von E-Mail sehen die Internet-Nutzer in Deutschland in jenen Situationen, die keine Echtzeit-Antwort erfordern sowie bei emotional unproblematischen Angelegenheiten.
Konkurrenten von E-Mail sind Fax, Telefon, SMS und Postkarte. Brief und persönliches Gespräch werden als eher komplementär zu E-Mail wahrgenommen.
Die derzeitige Positionierung von E-Mail erweist sich als (noch) nicht unique. Dies ist für neue Produkte durchaus typisch: Spezifische Einstellungs- und Verhaltensmuster müssen sich erst entwickeln und verfestigen.
 

5        Ausblick

Wenn situative, personenübergreifende Verhaltensmuster für das Kommunikationsverhalten prägend sind – wie diese Studie bei privaten Internet-Nutzern in Deutschland zeigt –, dann brauchen wir hierfür eine passende Begrifflichkeit. Mit dem Ziel, Kommunikationsverhalten besser beschreiben, erklären und prognostizieren zu können, schlagen wir deshalb vor, den von Freyermuth (2000) eingeführten Begriff der Kommunikette auf Verhaltensweisen zu erweitern:

Kommunikette º

- Situatives Muster des Kommunikationsverhaltens,
- das personenübergreifend gültig ist, d. h. für den überwiegenden Teil einer Gesellschaft oder für (Sub)Kulturen und
- das temporär bzw. veränderlich ist.

Aussagen über Kommuniketten sollten demnach drei Dimensionen berücksichtigen: die Situation, die Gesellschaft und die Zeit.
Ein allgemeiner Forschungsbedarf ergibt sich insbesondere hinsichtlich folgender Themen:

  • Messkonzept/Messung:
    Welches sind die relevanten bzw. interessierenden Merkmale einer Kommunikette, und wie sollen sie gemessen werden?
  • Hypothesen/Theorien:
    Welche Gruppen sind die Innovatoren neuer Kommuniketten? Unter welchen Bedingungen diffundieren Kommuniketten in welche Gruppen?

In Hinblick auf die Zukunft der E-Mail-Kommunikation wären speziell die folgenden Punkte von Interesse:

  • Verfestigung und Veränderung von Kommuniketten im Zuge der Diffusion:
    Wie wird die Diffusion der E-Mail-Kommunikation in weitere Schichten und Milieus bestehende Kommuniketten verändern?
  • Tragfähigkeit der Position von E-Mail für unterschiedliche Kommuniketten:
    Kann das Medium E-Mail sowohl eine unverbindliche Geschäftsanbahnung als auch rechtsverbindliche Geschäftsabschlüsse leisten?

Wie diese Studie zeigt, lohnt es sich für die E-Mail- und Kommunikationsforschung, zukünftig den Blick stärker auf situative Determinanten sowie deren Wechselwirkungen mit personalen Merkmalen zu richten als bisher. Mit anderen Worten: Wer Kommunikation verstehen will, muss Kommuniketten verstehen.


Literatur

ADM, ASI, BVM, D.G.O.F.: Standards zur Qualitätssicherung für Online-Befragungen, Mai 2001.

Freyermuth, G. (2000): Kommunikette: Verbindliche Regeln im digitalen Verkehr steigern die Effizienz. c't, Nr. 12, 92-97.

Schneewind, K., Schröder, G., Cattell, R. (1986): Der 16-Persönlichkeits-Faktoren-Test (16 PF), Testmanual. 2. Aufl., Bern, Stuttgart, Toronto: Verlag Hans Huber.

Zaichkoswki, (1987): The Emotional Aspect of Product Involvement. Advances in Consumer Research, Vol. 14, 32-35.


Janetzko, Dietmar ; Institution: Institut für Informatik und Gesellschaft, Albert-Ludwigs-Universität Freiburg
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Web-Mining mit Bayes-Netzen."


Jonas, Kai J. ; Institution: Georg-Elias-Müller-Institut für Psychologie, Georg-August-Universität Göttingen
Article (version: 25/06/2002 - 07:47, size: 2211)
"Stereotypentwicklung in cvK"
German:

Eindrucksbildungsprozesse könnten in der computer-vermittelten Kommunikation (cvK) Mediembeschränkungen unterliegen. Diese Sichtweise wurde in der frühen Forschung (Reduced Social Cues, Sproull & Kiesler, 1991) vertreten. Neuere Perspektiven gehen trotz der relativen Reizarmut von der face-to-face Kommunikation ebenbürtigen oder hyperbolisierten Prozessen aus (Hyperpersonal Perspektive, Walther, 1997). Dabei wurden jedoch noch nicht klassische Eindrucksbildungsprozesse, wie die SFP und insbesondere die Entwicklung von Stereotypen untersucht.

In diesem Vortrag sollen Studien und Ergebnisse zur Eindrucksbildung in der cvK zusammengefasst werden und Aufklärung zu dem Befund der Hyperpersonal Perspective liefern, dass Eindruckbildungsprozesse in der cvK immer einen hyperbolisch positiven Verlauf nehmen. Zudem gilt es zu prüfen, ob das Modell durch die SFP bereits hinreichend erklärt werden könnte. Es werden vier Studien sowohl aus interpersonaler als auch aus intergruppaler Perspektive berichtet.

In der ersten Studie zur SFP konnten keine systematischen Ergebnisse hinsichtlich der Frage nach der hinreichenden Erklärung der Hyperpersonal Perspective erzielt werden, was auf Medienspezifika und die Frage nach der Universalität des SFP-Phänomens zurückzuführen ist. Jedoch wurde die Hyperpersonal Perspective nicht bestätigt. In der Folgestudie konnten die relevanten Ergebnisse repliziert werden und weitere Befunde deuten auf differenzierte Prozesse der Eindrucksbildung hin.

Dieses Ergebnis konnte auch durch die Studien im intergruppalen Setting bestätigt werden. Bereits mit marginaler Informationsmenge über eine outgroup bildet sich ein konsensual geteiltes Wissen über diese Gruppe. Je nach Bedingungsvariation (Stimmung und Kategorisierung) kann dieser Prozess in bezug auf die Negativitätseinschätzung beeinflusst werden.

Die Ergebnisse liefern ein differenziertes Bild zur Eindrucksbildung in der cvK und legen eine auf spezielle Settings beschränkte Gültigkeit der Hyperpersonal Perspective nahe.


English:


Kreuels, Bernd ; Paßmann, Jessica Institution: Lehrstuhl für Marketing, Universität Dortmund
Article preliminary article (version: 25/06/2002 - 07:47, size: 11)
view preliminary article - edit preliminary article - upload an image(for authors only)
"OSAC 2.0 (Online Survey Access Control): Webbasierte Steuerung einer Online-Befragung"


Lam, Scarlett Li ; Myers, John G. Institution: Department of Marketing, University of California at Berkeley
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Measuring Web Site Personas."


Leaning, Marcus ; Institution: Department of Media Arts, University of Luton
Article (version: 25/06/2002 - 07:47, size: 11640)
"New Media and the Post-Human Self: An alternative account of the relationship of technology to the individual in the self encountered in interpersonal communications using new media."
German:

New Media Technology and the Post-Human Self:
An alternative account of the relationship of technology to the individual in the self encountered in interpersonal communications using new media.

With all the research that has been performed on the idea of cyber-space as an alternate reality or somehow mystical space (Heim 1991) it is sometimes easy to forget how computers and the Internet were actually intended as a tool to complete difficult or complicated tasks rapidly and with accuracy. As noted in many accounts of the origins of the computer industry, computers were conceived with specific tasks in mind, the calculation of artillery shell trajectories (Wise 2000) or keeping hospital records (Myers 1988) for example. Computers were conceived as applied technologies, devices to perform tasks that were beyond normal human capabilities.

The sheer complexity of modern computers and networking systems has seemingly blurred this original rationale for usage. I contend that only by looking at computers and the Internet in this more simplistic fashion can we begin to understand the effective and substantive nature of the technology.

To examine information communication technologies such as the Internet as tools affords us a range of critical perspectives that may be lost if we move further up the scale of complexity and begin to view them as some form of enabling or 'invocational' technology (Cheshire 1997) that offer us doorways to an alternate reality.

Here I want to pursue one of these perspectives in relation to the Internet. I hope to explore the ways in which the use of this technology necessitates a re-conceptualisation of the way in which we view the individual we encounter in interpersonal communication using the Internet.

However the use of the word tool when referring to such technologies implies a certain stance or position in our relation to the technology. A tool is something we use, it is something we can pick up and put down. Perhaps most importantly a tool is something that does what we want. It is dead, inert and passive and while it may extend our capabilities it has no effect upon us or the world without our specific intention.

Latour (1987) offers a different description of the use of a tool that I believe may prove particularly useful in examining technologies such as the Internet and activities such as communicating through the Internet. Latour claims that in using technology we are integrating ourselves into networks where both the technology and human actors must be considered as having agency (effective if not volitional). Latour examines how we both delegate tasks to technology, the labour saving device, and are in turn regulated by the technology. Technology, argues Latour, regulates our action though our integration into technological systems. We have technology perform the tasks that are too mundane or difficult for normal people. However in 'delegating' to technology we accept the way in which the technology will perform the task, that the task will be performed in a specific fashion. This fashion, or way of performance then sets the way in which the task is carried out and we work with this way of doing the task.

Latour cites the example of a door, it makes it possible to walk through a wall without having to knock it down and rebuild it each time but we accept the location of the door as a restriction as to where we can pass through the wall. In this way technology reflects back upon us, it in part structures our action. No longer do we have complete volition of where we choose to pass through the wall. If we accept the benefits of a door we must also accept that it limits our freewill. In using technology our way of performing an action is limited and corralled by the technology.

Here he is not talking of strict technological determinism but rather of the way in which through delegating tasks to technology we abdicate complete conscious control of that task. Relating this to interpersonal communication through the Internet we can see how the 'technology' of the software that allows communication in some way limits the way in which we can communicate or present ourselves. The technology permits us the opportunity to communicate across vast distances instantaneously but it imposes its own regime upon the way in which we can communicate. This regime permits only certain methods of communication and polices this by the default of our usage. By using the technology to present ourselves in far off places we accept technology's limitations on the way in which we can communicate. The structure of the technology limits the ways to which the technology can be used.

The technology can be said to 'reflect' back upon us, we don't simply have a master servant relationship with technology, rather it is a dynamic bi-directional relationship. We use technology to perform tasks but we are in turn structured by the use of the technology.

All this is very well, technology limits what we can do with it, we can only use Internet technology to communicate in certain ways, but so what? What difference does this make?

I want to argue that in using technology we are accepting limitations upon the way we can present ourselves online that have seemingly been ignored in previous accounts of online communication. Many previous accounts have focussed upon the idea that new media technology offers a new opportunity to completely control the presentation of self that one meets online. These claims are primarily built around the idea that on line we can completely control the social 'cues' we give out and therefore the self we present is purely of our own intention. The self here is a purely conscious entity, a master of its social situation and able to skilfully use this knowledge in the presentation of what the world will know of it. However I contest that the nature of the relationship we have with technology means that the presentation of self is not one of complete volition.

It is my assertion that we need to look at the level of thinking or consciousness to understand the way in which technology structures our social action and in turn our presentation of self. We are so used to using technology, to being part of technological networks, that technology infects us at the lowest levels of conscious thought, our practical consciousness.

Our 'practical consciousness' is that aspect of our consciousness that allows us to be in the social world. This is part of the Giddensian model of consciousness. Anthony Giddens (1979, 1991) sees two elements of mind, practical and discursive consciousness. Discursive consciousness is that knowledge that we can reflect upon consciously, we can bring it to mind. Practical consciousness however, is the mundane day to day essential practicalities of living in a social world. It is not the knowledge we think with or bring to consciousness but knowledge that we use pre reflexively. It is the internalised, pre-reflexive, inter-subjective reality that buffers our moment to moment interactions with the world, the 'rules and resources' that order everyday life.

This is Giddens's idea that social life does not simply restrict the action of preconceived agents, rather social life provides resources that allow us to 'be' in the social world. There are no preconceived agents rather we are constituted through being in the social world.

I maintain that the technological network is a social system with its own rules and resources. Again here we are referring back to the idea that technology is not just a tool but a system or set of social practices. As we are part of the technology, the technology reflects back upon us as rules and resources.

Therefore in using the technology we enter into a network, we are an actor (or actant) within that network. Our actions in the network are performed pre-refelexively, they are structured and made possible through the rules and resources that the technology provides. The rules and resources provided to us by our role in the network of technology enter into our practical consciousness and become part of the way in which we can Act and Be. In using technology we are submersing our being into a network of actors. It is however a two way process, we give up aspects of our self, our volition is restricted or corralled, but simultaneously we gain new aspects of being, we are gaining technological being. When we are using the technology we are Being in a network of technology.

In using technology we have integrated ourselves firmly into technology but technology is also integrated into us at the level of practical consciousness. Our very way of being, our entry point into the social world, our presence in the world, is, in this sense, technological. Communicating using the Internet is not simply using technology to reach distant places rather in using the technology we are in part technologically constituted. The self that we encounter through electronic media is in part constituted through that media as the media makes it possible to 'Be' in that system. This sense of 'being' is not just one of an extension of presence of an existing entity, rather the self or identity does not exist outside of social world. In this case the 'social' world is a technological system and therefore the self that exists in this world must be in part considered a partly technologically constituted entity.

This idea poses a challenge to the concept of the self as purely a human phenomena which uses technology or tools. If aspects of our consciousness, our very basis of human self, are technologically constituted we cannot claim to be that purely human entity. We must move on to a new description of the Self.

I propose that in environments where technology plays such a key role in determining and constituting our selfhood we should consider the self to be 'post human' in the sense that the humanist notion of a completely free agent constituted prior to the means of communication is redundant. The post human agent is an acknowledgement of the role that technology plays in structuring our self and identity.

When we want to talk of issues of identity and subjectivity of people using the Internet we must include the role technology in accounts of the self.
 
 

References

Cheshire.C, (1997) The Ontology of Digital Domains, in Holmes.D Virtual politics: Identity and Community in Cyberspace, Sage, London.

Giddens.A, (1979) Central Problems in Social Theory Macmillan, London.

Giddens. A, (1991) Modernity and Self-Identity ,Polity, Cambridge.

Heim.M, (1991) The erotic ontology of cyberspace in Benedict.M, (1991) Cyberspace: First Steps, (pp. 59-80), MIT Press: Cambridge, MA.

Latour.B, (1988) Mixing Humans and Nonhumans Together: The Sociology of a Door Closer, Social Problems, Vol. 35 No.3, pp 298-310, June 1988.

Meyers, J, A Short History of the Computer Online Available http://www.softlord.com/comp/ 12.04.01

Wise.R, (2000) Multimedia: A Critical Introduction, Sage: London.


Lengler, Ralph ; Reips, Ulf-Dietrich Institution: Universität Zürich
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"WWW-based IQ testing with speed components."


Lobin, Daniela ; Kreuels, Bernd Institution: Lehrstuhl für Marketing, Universität Dortmund
Article (version: 25/06/2002 - 07:47, size: 1457)
"Nutzungsmotive, Erwartungen und Zufriedenheit von Mitgliedern einer Virtuellen Community."
German: Trotz der zunehmenden Zahl von Virtuellen Communities (VC's) liegen bisher kaum Erkenntnisse über die von VC-Mitgliedern wahrgenommene Beziehungsqualität vor. Diese bildet jedoch die entscheidende Basis für die Mitgliederbindung und stellt die Grundlage für die Nutzung der VC für das Relationshipmarketing von Unternehmen dar. Im Rahmen dieser Untersuchung wird ein Messinstrument für die Mitgliederzufriedenheit entwickelt, die als Teilkonstrukt von Beziehungsqualität ein notwendiges, jedoch nicht hinreichendes, Konstrukt für die Kundenbindung darstellt. Zielsetzung ist es, einzelne Faktoren zu identifizieren, die zur Zufriedenheit mit VC's führen und somit elementare Gestaltungskriterien bilden, um eine langfristige Kundenbindung zu erreichen. Durchgeführt wurde die Untersuchung in Zusammenarbeit mit einer themenspezifischen, verbraucherorientierten VC, bei deren Mitgliedern die spezifische Mitgliederzufriedenheit erhoben wurde. Die Entwicklung des Messinstruments basiert auf dem SERVQUAL-Ansatz, der durch qualitative Interviews für die Messung von Mitgliederzufriedenheit von VC's weiterentwickelt wurde. Das Ergebnis der Untersuchung bildet eine Messskala mit fünf Dimensionen, die für die Messung der Mitgliederzufriedenheit geeignet ist, jedoch durch weitere Erhebungen validiert werden muss. Dieses Messinstrument konnte in bezug auf die Fallstudie erfolgreich eingesetzt werden, um strategische Handlungsempfehlungen abzuleiten.


Lossau, Norbert ; Institution: Niedersächsische Staats- und Universitätsbibliothek Göttingen
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"The Digitization Center (GDZ) of Göttingen State and University Library: bringing primary (print) resources online."


Maisch, Susanne ; Institution: EarsandEyes GmbH, Hamburg
Article preliminary article (version: 25/06/2002 - 07:47, size: 0)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Kids, das schwarze Loch der Marktforschung."


Mangold, Roland ; Institution: Lehrstuhl Psychologie III, Universität Mannheim
Article (version: 25/06/2002 - 07:47, size: 13328)
"Netzgestützte Trainings – the best of both worlds?"
German:
Die bei der Betrachtung des Wissenserwerbs mit Neuen Medien vielfach dominierende Auffassung einer Wissenskonstruktion geht gleichzeitig
mit einer veränderten Sichtweise auf die Rolle des Dozenten/Lehrers/Trainers im Rahmen von Wissenserwerbprozessen einher: Nicht mehr der kenntnisreiche Wissensanbieter, sondern der Coach bzw. Tutor steht im Vordergrund, der den Wissenserwerbsprozess des Lernenden begleitet, ihn bei der Aneignung neuen Wissens berät und zusammen mit ihm Lösungen für sich dabei ergebende Probleme erarbeitet. Tele-Tutoring bedeutet, dass dieser Coaching-Prozess als medialer Kommunikationsprozess abläuft. Aus der Ferne betreut der Trainer bzw. Dozent den Wissenserwerb der Lernenden mit Hilfe von Email, Foren, Chat oder Videokommunikation. Nicht alle Wissensbereiche sind gleichermaßen geeignet für eine Vermittlung aus der Ferne. Telelernen bietet sich für Erwerbsprozesse, bei denen die Vermittlung von Faktenwissen im Vordergrund steht. (In der kognitiven Psychologie wird Faktenwissen auch als deklaratives Wissen bzw. als "Wissen dass" bezeichnet.) Faktenwissen wird in Kontrast gesetzt zu Handlungswissen (prozedurales Wissen, "Wissen wie"), das nicht nur motorische Fertigkeiten, sondern generell eher automatisierte Wissen über Vorgehensweisen bzw. Strategien betrifft. Zielführendes Handlungswissen besteht aus "skills"; Handlungsfertigkeiten finden sich beispielsweise im mathematischen, im physikalisch-technischen oder im sozialen Bereich. Der Erwerb bzw. die Erweiterung sozialer Skills steht im Mittelpunkt (psychologischer) Trainingsmaßnahmen. So werden häufig in Trainings Sozialkompetenzen wie das Kommunizieren im Betrieb, die Moderation und die Leitung von Gruppen, das Lösen von Konflikten oder die Präsentation von Informationen für ein Publikum mit Hilfe von Medien vermittelt. Für die Vermittlung von Faktenwissen aus der Ferne eignet sich das Internet; hier können Lernende Text- und Bildinformationen abrufen und in interaktiver und selbstgesteuerter Form zu deklarativem Wissen machen. Ein Beispiel für entsprechende Inhalte aus der Kognitiven Psychologie stellt das Webangebot und www.incops.de dar.) Auf der anderen Seite scheint das Internet zunächst weniger geeignet für die Durchführung von wie zuvor beschriebenen Trainings sozialer Fertigkeiten, da solches Trainings in hohem Maße auf einem Ausprobieren, auf Rückmeldungen und auf der Beachtung des Verhaltens anderer aufbauen, was einen unmittelbaren (Face-to-Face-) Kontakt voraussetzt. Obwohl, wie bereits erläutert, bei Trainings die (kaum anders als direkt erfahrbare) Verhaltenserprobung und -verbesserung im Vordergrund stehen, gehört auch zu Training gehört in gewissem Umfang deklaratives Fakten- und Regelwissen, bei dem eine Vermittlung über entsprechende Netzangebote nicht ausgeschlossen ist. Die Anteile von deklarativem und prozeduralem Wissen lassen sich am Beispiel eines Präsentationstrainings deutlich machen: (i) Einmal werden im Präsentationstraining solche Verhaltensweisen mit den Teilnehmern/innen besprochen und eingeübt, die unter anderem das Auftreten, die Vortragstechnik, die Sprechweise oder die Koordination des Vortrages mit den Visualierungsmedien betreffen. Solche Verhaltensaspekte werden vorzugsweise im Rollenspiel oder in Übungsfällen ausgeführt und im Anschluss daran erörtert bzw. kritisiert. Die Rückmeldungen des Trainers oder anderer Lernender finden eine optimale Ergänzung durch Videofeedback, bei dem die Aufzeichnung des Präsentationsverhaltens zu Demonstrationszwecken ausschnittsweise abgespielt und im Detail erörtert werden kann. (ii) Zum zweiten gehören zum zielführenden und erfolgreichen Präsentieren auch Wissensbestände, die - zumindest am Anfang - in deklarativer Form vermittelt und repräsentiert werden. (Es ist zu erwarten, dass solche deklarativen Wissensbestände bei entsprechend häufiger Anwendung und Übung in prozedurales Wissen überführt werden können.) Zu solchem Wissen gehört bei einem Präsentationstraining etwa die Einsicht, dass eine Präsentation als Kommunikation zu behandeln ist und somit im Hinblick auf das Ziel, die Publikumsaussage, die Sachaussage und die Selbstausstellung des Vortragenden zu analysieren ist. Zu den deklarativen Wissensfacetten des Präsentieren gehört die Kenntnis der Unterscheidung von Präsentationsarten (Inhalts- vs. Überzeugungspräsentation), von Strategien für Einleitung und Schluss sowie von Hinweisen für die vokale (Sprechführung, Atmung) und nonverbale Ausgestaltung (Gestik, Auftreten, Kleidung etc.). (iii) Einen dritten Aspekt stellen Hinweise zur Foliengestaltung dar. Auch dieses Wissen ist zunächst primär deklarativer Natur und umfasst etwa Hinweise zur Schriftgestatlung, zur Farbwahl, zur Anordnung von Elementen etc. Bei dieser dritten Gruppe von Wissensbeständen ist nicht nur die Vermittlung, sondern auch das Üben über das Netz vorstellbar. (Das gilt nicht für das Übungen der unter (ii) beschriebenen Bestandteile des Präsentationswissens.) So können Teilnehmer zu vorgegebenen Themen Präsentationen erstellen und diese Präsentationsdateien per Email an den Trainer senden. Dieser sieht die eingegangen Ausarbeitungen durch und gibt den Teilnehmern Rückmeldung und konstruktive Kritik. (Im Einzelfall bietet sich auch die Möglichkeit, die Präsentationsdatei eines Teilnehmers zu verändern bzw. zu korrigieren und die veränderte Datei zurückzugeben.) Die Entwicklung des nachfolgend ausführlicher beschriebenen netzgestützten Präsentationstrainings wurde angeregt im Rahmen eines Kooperationsabkommens der Universitäten Saarbrücken und Trier. Obwohl der einen Universität an Lehrveranstaltungen der anderen Universität teilnehmen können und Leistungsscheine wechselseitig anerkannt werden, wurde bald deutlich, dass die Studierenden das Angebot der jeweils anderen Universität zwar gerne für sich nutzen würden, dass viele aber aufgrund der Entfernung (ca. 100 km) nicht vierzehntägig und schon gar nicht jede Woche zur Partneruniversität fahren würden, sondern maximal drei- oder viermal pro Semester die Strecke in Kauf nehmen würden. Ein im Sommersemester 1998 an der Universität Saarbrücken angekündigtes Präsentationstraining fand großes Interesse auch der Psychologiestudierenden an der Universität Trier. Vor dem Hintergrund der zuvor beschriebenen Einschränkungen sollten bei diesem Training, um die erforderlichen Präsenzzeiten kurz halten zu können, alle über das Netz vermittelbaren Komponenten des Präsentationswissens aus der Präsenzphase herausgenommen werden. Hierzu zählen u.a. ein als interaktives Webdokument aufbereitetes Skript zu den Grundlagen des Präsentierens sowie Aufgaben zur Vertiefung des Skriptinhaltes. Zur Förderung der Kommunikation zwischen den Teilnehmern enthielt das Netzangebot auch die Emailadressen aller Teilnehmer/innen. Alle eingereichten Aufgabenlösungen wurden vom Trainer kommentiert und zusammen mit diesen Kommentaren in das Netzangebot integriert. Die Teilnehmer/innen waren gehalten, selbst auch Rückmeldungen zu den Ausarbeitungen zu geben; diese Kommentare wurden in einer zweiten Runde ebenfalls in das Netzangebot integriert (= moderiertes Forum).Im Verlauf der Netzphase von acht Wochen fertigten die Teilnehmer/innen eine Analyse ihrer Präsentationssituation an und erstellten eine Präsentation (Dauer: 20 min), die im Rahmen des Präsenztrainings die Grundlage für die Verhaltensübungen darstellte. Mit finanzieller Unterstützung der Universität Saarbrücken (Anreizmittel zur Verbesserung der Lehre) wurde das netzgestützte Präsentationstraining in seiner ersten Form entwickelt und im SS 98 mit zwei gemischten Gruppen aus (jeweils n=8) Teilnehmern/innen der Universitäten Saarbrücken und Trier sowie im WS 1999/2000 mit einer Gruppe von acht Studierenden der Universität Mannheim durchgeführt. Das Training wurde danach gründlich überarbeitet und wird jetzt auf einer eigenen Website (www.mangold-training.de) bereitgestellt und durchgeführt. Das netzgestützte Präsentationstraining ist in seiner jetzt vorliegenden Form unterteilt in eine Präsenz- und eine Netzphase. ((i) Die Präsenzphase setzt sich zusammen aus einer "Kickoff-Veranstaltung" zu Beginn sowie - je nach Gruppengröße - einem oder zwei Abschluss- bzw. Übungstagen. Der Kickoff-Termin (Dauer: ein Vormittag) dient dem Kennenlernen der Teilnehmer/innen; an diesem Tag wird in Gruppenarbeit eine Spontanpräsentation zu den Erwartungen der Teilnehmer/innen erstellt, die Regeln des Gebens von Feedback werden erläutert und am Beispiel der Spontanpräsentation eingeübt. Zudem wird den Teilnehmer/innen das Netzangebot in seinen diversen Facetten erläutert. Am Abschlusstag werden die im Verlauf der Netzphase von den Teilnehmerinnen erstellten Präsentationen dargeboten. Das Thema der Präsentation sollte dem Arbeitsgebiet der jeweiligen Teilnehmer/innen entnommen sein; als Dauer der Präsentationsdarbietung sind 15 Minuten vorgegeben. Die Teilnehmer/innen sind gehalten, bei der Darbietung nach Möglichkeit multimediale Elemente des verwendeten Präsentationsprogrammes zum Einsatz zu bringen (animierte Folienübergänge, Animationen auf Folien, Klänge, Musik). Am Abschlusstag werde die Präsentationen mit Hilfe einer Computer-Beamer-Kombination in einem Raum der beauftragenden Institution vorgeführt. Auf diese Weise können die Teilnehmer/innen Erfahrungen mit elektronischen Präsentationen sammeln. Die Präsentationsdarbietungen werden aufgezeichnet; die Teilnehmerinnen erhalten nach Abschluss des Training eine Videocassette mit ihrer Darbietung sowie eine ausführliche Rückmeldung des Trainers. (ii) Das Netzangebot umfasst ein Skript zur Präsentation, Aufgaben zum Skript, Beispiele von gelungenen und weniger gelungenen Präsentationen sowie eine "Tipps-und-Tricks-Ecke". Es hat sich als sinnvoll erwiesen, auf das interaktive Lehrangebot zu den Grundlagen des Präsentierens zu verzichten und vielmehr den Personen ein ausdruckbares Skript als Datei zur Verfügung zu stellen. (Die Teilnehmer möchten bei der Lektüre nicht an den Rechner gebunden sein und auch nicht für verbrauchsbezogene Onlinekosten aufkommen müssen.) Als Aufgaben wurden vorgegeben: (1) Erstellen eines Aushangs für das schwarze Brett zur Ankündigung des Präsentationstrainings, die Kommentierung vorgegebener Präsentationsbeispiele und die Integration von Animationen und Klängen in eine vorgegebenen Präsentationsdatei. Außerdem sollten die Teilnehmer/innen für ihre Präsentation eine ausführliche Situationsanalyse erstellen sowie eine Präsentation für den Abschlusstag erstellen. Die entsprechenden Präsentationsdateien sollen einige Zeit vor dem Abschlusstag dem Trainer sowie einem vorbestimmten "Coaching-Partner" zugeschickt werden, um so Rückmeldungen, Anregungen und Verbesserungsvorschläge zu erhalten. Im Rahmen einer Kooperation mit einer Akademie im Raum Karlsruhe konnten weitere Erfahrungen zu den Einsatzmöglichkeiten des netzgestützten Präsentationstraining gesammelt werden. Insbesondere waren folgende Punkte auffallend: (i) Zur Benutzung des Webangebotes gehört eine (nicht nur technische) Medienkompetenz. Probleme, die sich mit der Benutzung von Emailprogrammen, Präsentationsprogrammen oder eine virtuellen Gruppenraums (www.nicenet.org) ergeben, stellen gelegentlich ein ernst zu nehmendes Hindernis dar. In diesem Zusammenhang ist die "Kickoff"-Veranstaltung außerordentlich wichtig, bei der die Benutzung des Webangebotes vorgestellt und besprochen werden kann. (ii) Insbesondere in der Mitte der Netzphase bzw. zu Zeiten verstärkter anderweitiger Aktivitäten (Weihnachten, Ostern) haben die Teilnehmer/innen große Schwierigkeiten, Aufgabenbearbeitungen rechtzeitig einzureichen oder Bearbeitungen anderer zu kommentieren. Es ist sehr wichtig, in solchen Zeiten die Einhaltung der Vorgaben nicht zu rigide durchzusetzen und die Teilnehmer/innen mit Hilfe verständnisvoller Emails zu motivieren. (Die Gefahr eines Drop-Outs ist in solchen Phasen am stärksten ausgeprägt.) Eine zusätzliche Unterstützung könnte hier eine bessere Integration des Trainings in den betrieblichen Alltag bieten. (Lernen für ein Präsentationstraining sollte - sofern vom Betrieb gewünscht - in der Arbeitszeit stattfinden können und als Arbeit auch anerkannt sein.) (iii) Zwischen den Teilnehmern/innen finden nur wenig Kommunikation statt. (Obwohl es nicht zu scheint, lassen sich auch Themen aus dem Bereich des Präsentierens intensiv diskutieren, z.B. die Verwendung animierter Listenpunkt oder die Wahl von Schriftarten.) Förderlich für die Kommunikation hat sich das Kennenlernen am Präsenztag zu Beginn des Trainings erwiesen. Ein weiteres kommunikationsförderliches Mittel ist das Zusammenstellen sog. "Coaching"-Partnerschaften. (iv) Allgemein begrüßt wurde die Bereitstellung von (professionellen) Präsentationsbeispielen, da diese viele Anregungen für eigene Entwicklungen bieten. Ähnliches gilt auch für die "Tipps-und-Tricks"-Ecke, die auch durch Anregungen der Teilnehmer/innen gestaltet wird und wächst. (v) Die am Abschlusstag vorgestellten Präsentationen weisen durchweg eine beachtliche Qualität auf. Sie zeigen, dass sich die Teilnehmer/innen intensiv auch um den Einsatz neuer Techniken elektronischer Präsentationen bemüht haben und auch für Neues offen sind. Dass sie letztlich mit Freude gearbeitet haben, zeigen auch die Urteilswerte im Evaluationsbogen.


Matzat, Uwe ; Institution: Interuniversity Center for Social Science Theory and Methodology (ICS), Department of Sociology , University of Groningen
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Social network effects as stimuli for active user participation in electronic groups? An empirical test of different theories with the help of academic Internet Discussion Groups. "


MacElroy, William H. ; Institution: Modalis Research Technologies, Inc., San Francisco
Article (version: 25/06/2002 - 07:47, size: 16302)
"How The Internet Will Kill Three Of The Four Ps Of Marketing (And How Market Research Will Be Subsequently Changed Forever)."
German:

Introduction

McCarthy's Four P classification of marketing mix components has been widely discussed and accepted as a model for understanding the basic marketing processes (McCarthy,1960. Kotler, 1972. et. al.). In more recent years, a number of authors have expressed criticisms of the workability of the model, because of its vagueness with regard to the definition of some components (e.g., "sales promotion"), the lack of mutual exclusivity between components, and in total collective exhaustiveness (van Watershoot and Van den Bulte, 1992). But just as the taxonomical issues in defining marketing processes are difficult to articulate (Hunt and Hunt, 1982) in a static economic system, changes such as those brought about by the Internet may make the effort outdated.

Of the many classification systems that have been proposed over the years, only McCarthy's has survived—It has become the "dominant design" or "received view" (van Watershoot and Van den Bulte, 1992, p.84). His model proposed four discrete, controllable functions: Product, Price, Place, and Promotion. Each of these functions is then "managed" to create the best overall application of techniques and technologies for the given market environment.

The traditional process of market mix management may involve a number of steps including: problem identification, research objectives and design, data collection, analysis, recommended actions, management consideration and, finally, action in the form of broad policy implementation.

The Internet, however, is creating what Thomas Kuhn (1962, p 76) referred to as a “technological period of crisis and discontinuity.” He added that the significance of the crisis is the indication that the “occasion for retooling has arrived.” The retooling in this instance may involve a change in the way marketing mix policies are created and implemented.

The primary reason for this change is that the marketing process, which used to take months, is now being conducted in milliseconds online. The formation of marketing mix policy is being replaced by instantaneous one-to-one modeling capabilities. These trends will contribute to a major restructuring of the way the business of marketing research is conducted. This paper will outline these changes and the direction of marketing research in general and as it relates to investigating issues associated with each of the 4Ps.


Product

The main objective of the product element of the marketing mix strategy is to optimize the product for sale to meet the requirements of the potential customer. Of course, this also includes product updates as necessary, and when feasible, in order to keep up with the changing needs of the consumer. By employing the advantages of technology, "ideal products" can be configured in real time in a one-to-one marketing environment. Configuration offers a marketing organization the potential to finally be armed with the “right” product for each customer.

An example of this type of process and technology can be seen at work in companies like Dell Computer, where customers “build” a computer for their specific needs from a set of optional components.



Figure 1. Dell Computer’s online product customization www.dell.com

As marketing professionals become more comfortable with the power of the Internet as forum for one-to-one marketing, the real time configuration of products may allow marketing research to fully embrace the product element of the marketing mix equation.

While a few companies are currently taking advantage of the ability for real time product configuration, it is clearly not widespread. There is encouragement that the power of real time product configuration will be embraced and become more popular. This approach may be particularly useful to organizations that are converting other, more traditional product-related research techniques to the online environment.

Survey data used throughout this paper to illustrate trends in online marketing research practices were collected in a year 2000 SIRCUS study of 341 marketing research providers and consumers. This study was jointly sponsored by the A.C. Nielsen Center for Market Research at the University of Wisconsin-Madison, Modalis Research Technologies, and the Institute of International Research. Among research organizations included in the 2000 SIRCUS survey that also conduct product concept testing, nearly one-third had conducted a concept test online. A fair number of these organizations have also used online methodologies in conducting other product testing related research (see Figure 2).



Figure 2. Use of the Internet for product testing related marketing research

Price

Pricing "policies" are being replaced by “smart intercepts.” In this model, each consumer who is purchasing a product or service online is offered any one of a number of initial price points. By tracking which prices lead to a consummated sale, an optimal price point (or set of price points) is determined. With each iteration, or consumer, the data upon which price is determined grows and the price being offered stabilizes at the price that has proven to increase revenue margins.

Currently, 17% of research organizations are using the Internet for general pricing research (SIRCUS, 2000). However, as is the case with product-related marketing research on the Web, few companies in the study had fully embraced the power that the online environment provides in terms of the ability to constantly monitor consumer responses to stimuli and make adjustments accordingly.

Price sheets, which are the deliverable outcomes of fixed pricing policies, are being replaced by what some are describing as a "digital bazaar" economy. This refers to situations in which customers with semi-perfect knowledge of multiple sources conduct real time negotiations in order to obtain the best prices. The ability to evaluate vendors (which can be compared, side-by-side on many easily accessible Web sites) is leading to something resembling "perfect price competition," in which the customer has an ability to constantly monitor and adjust purchase behavior. Vendors, on the other hand, can also monitor and adjust pricing strategies, tailoring them to specific individuals based on any number of criteria (e.g., estimated lifetime value of purchases, total past purchases, competitive sites visited, etc.).



Figure 3. Dell real-time pricing and promotion example www.dell.com

Promotion

Traditional promotional strategy is being replaced online by navigation sensing technologies. This new type of tracking technology can identify “lost souls” online in the same way a good retail clerk can tell when to ask a customer if he or she needs help by simply observing whether his or her behavior appears to be seeking something that cannot be found. The key to this technology is identifying navigational patterns and previously observed outcomes to identify—in real time—those individuals who may be likely to become frustrated or confused and thus abandon the purchase.

The ability of technology to optimize online promotion is similar to the application of technology used to determine the perfect price, as described in the previous section. Initially, the system can be preloaded with users’ click-stream data in order to determine patterns that lead to undesirable outcomes. Systems can be programmed to send a message offering to help the shopper who needs help if it (the system) detects a consumer who is “lost”—i.e., on a path that has been shown to lead to a no-sale. If the shopper does need assistance, that help can be delivered through either an automated response or with a live customer service representative. (Live customer service reps on the Web may be cost-effective if their presence convinces frustrated customers not to abandon their transactions on the site. See Figure 3.)



Figure 4. Lands’ End live personal shopper www.landsend.com

Over time the system can become “smarter” by learning which intercepts offering assistance work and which do not. Smart intercepts help create a more conversational environment between the online shopper and the e-tailer and they allow for the same sorts of beneficial consumer feedback that have worked well for retailers over the years.

Smart intercepts can also offer suggestions and alternatives that are directly related to the visitors’ requests. By creating short, focused data input forms, the program can generate suggestions based on what others have historically found satisfactory. Once again, the systems can become smarter over time by “learning” what makes something appropriate for particular types of shoppers. This technology has been particularly effective when the shopper is buying for someone else and needs suggestions.

The use of smart intercept technology not only has benefits in terms of custom delivery of promotional materials, it can also be used to enhance the manufacturers’ understanding of market behavior. The marketing research efforts that are employed to assess a promotion’s effectiveness, for example, are drastically improved by this technology. The data that would traditionally be collected after a promotion campaign ends, and therefore be subject to respondent and measurement errors associated with self-reports, is collected as behavioral data—including both the system’s “decision” to deliver a particular intercept/promotion and the consumer’s behavior of making a purchase or not.

Placement (Distribution)

Regardless of the automation that technology allows for in one-to-one marketing with respect to product configuration, pricing, and promotion, goods eventually must be delivered. Placement, then, is the only "P" in McCarthy's mix that remains a significant offline policy issue for the online marketplace.

In terms of the traditional marketing mix, distribution therefore becomes a critical consideration and a point of competitive differentiation. In a recent study by UCLA (Jeffrey I. Cole, et. al. 2000. p.43), shipping issues topped the list of concerns superceded only by the concern of privacy of personal data. “Ease of returning or exchanging goods,” “delivery charges,” “product damage in shipping,” and similar issues related to distribution are significant barriers to e-commerce and possible sources of competitive distinctiveness.

While technology does not provide the same opportunities with regard to distribution related research as it does for the other areas of the marketing mix, 17% of research organizations that took part in the 2000 SIRCUS survey are using the Internet to conduct distribution channel research. Even though distribution itself remains firmly seated in the offline environment, those who are conducting distribution channel research online are mostly satisfied with their experiences in testing that experience online—mean score of 4.0 (SD = 0.6) on a 5-point scale of satisfaction (where “5” means being “completely satisfied with the use of the Internet for testing this subject.”) (SIRCUS, 2000).

The Outlook For Online Marketing Research

The shift in the importance of marketing mix elements in the e-commerce environment is also changing the research industry in its wake. Recent survey data indicates that online marketing research can expect to see large-scale growth over the next year. Among research suppliers and consumers who currently utilize online research, 70% report that they expect to increase their reliance on online research in the future. These data also indicate that online marketing research will experience an 11% growth in penetration to those who have never utilized online research over the next year (SIRCUS, 2000).

This expected growth is likely due to the consensus among marketing research providers and consumers that online research is both more cost- and time-effective than traditional research. These same survey data do, however, seem to indicate that some debate continues on the overall quality of online research as compared to traditional market research methods (see Figure 5).



Figure 5. Importance of various research characteristics and the performance of online research in these same areas (SIRCUS, 2000).

Conclusions

This brief overview of the impact of e-commerce on traditional marketing mix strategies and procedures is, of course, merely an observation of phenomenon that are continuing to evolve. The eventual impact of online technology on the industry as a whole, and on the marketing research industry specifically, is yet to be seen and is far from being quantifiable as an effect. More research on the subject and an in-depth study of how these changes are affecting businesses is needed.

The major conclusions based on the authors’ observations include:

· Web transactional technology (in which consumers’ behavior at an online e-tailer is collected and analyzed in real-time) holds the promise to reduce the time spent managing the marketing mix from weeks and months to minutes and seconds.

· When used to its fullest potential, this technology unifies the process of marketing research with the process of policy implementation.

· As demonstrated in this paper, one-to-one modeling can drastically reduce the need for post hoc research on product development, pricing, and promotional issues.


References:

Cole, Jeffrey I., et. al. (2000.) The UCLA Internet report: Surveying the digital future. University of California Los Angeles, Center for Communication Policy. [On-line] Available: http://www.ccp.ucla.edu/pages/internet-report.asp

Hunt, Shelby D and Kenneth A. Hunt (1982). Bartels’ metatheory of marketing: a perspective. In the proceedings of the 11th Paul D. Converse Symposium, David M. Garner and Frederick W. Winter, eds. Chicago: The American Marketing Association, 50-58.

Kotler, Philip, et. al. (1972). A generic concept of marketing. Journal of Marketing, 36, 46-54.

McCarthy, E. Jerome. (1960). Basic marketing: a managerial approach. Homewood, IL: Richard D. Irwin, Inc.

Miller, T. & Gupta, A (2001). Studies of information, research, and consulting services (SRICUS): Fall 2000 survey of organizations. University of Wisconsin Madison: A.C. Nielsen Center for Market Research.

Kuhn, T. (1962). The structure of scientific revolutions, third edition. Chicago, IL: University of Chicago Press.

van Watershoot, W. & Van den Bulte C. (1992). The 4P classification of the marketing mix revisited. Journal of Marketing, 56, 83-93.


Müller, Andrea ; Jonas, Kai J.; Boos, Margarete Institution: Georg-Elias-Müller-Institut für Psychologie, Georg-August-Universität Göttingen
Article (version: 25/06/2002 - 07:47, size: 14331)
"Modellfreie Erhebungsverfahren im Internet am Beispiel von Cognitive Mapping Studien."
German:

Online-Untersuchungen können zur Zeit eher noch als ein zartes Pflänzchen bezeichnet werden. Dem noch relativ neuen Untersuchungsmedium wird noch allzu oft zu kritisch entgegen getreten. Im Fordergrund stehen dabei eher Probleme der Stichprobengewinnung, aber es bestehen auch Unsicherheiten dahingehend, welche Erhebungsmethoden problemlos an das neue Medium adaptiert werden können. Daher sollte ein Ziel der aktuellen empirischen Sozialforschung darin bestehen, kritisch zu hinterfragen, für welche Arten von Befragungen und für welche Erhebungsinstrumente eine Online-Durchführung geeignet ist.

Modellfreie Erhebungsverfahren gehören in der kulturvergleichenden Psychologie, der Wissenspsychologie und in nicht-psychologischen Disziplinen wie der kognitiven Ethnologie zu den Standardinstrumenten. Unter modellfreien Erhebungsverfahren sind Verfahren zu verstehen, die eher auf qualitativen Erhebungen basieren und daher a priori keine inhaltlichen, strukturellen Erwartungen an die Ergebnisse stellen. Die Erhebungen jedoch folgen einem strukturierten Vorgehen.

Derartige Erhebungsverfahren werden jedoch aufgrund struktureller Anforderungen mittels paper & pencil oder im Laborsetting eingesetzt. In der Forschung zur kognitiven Kartierung von semantischen Domänen, z. B. Begriffsmengen, lassen sich diese Verfahren ebenfalls sinnvoll einsetzen. Die Stichprobenart (große, teilweise repräsentative Stichprobenziehung außerhalb des Labors, Zeitknappheit, Messwiederholungsproblematik) in diesem Forschungsfeld macht jedoch eine Vereinfachung des Instrumenteneinsatzes unter Beibehaltung der strukturellen Anforderungen (Linearität der Befragung, Datenreduktion per BIBD, Randomisierung) notwendig.

In zwei Studien zum Cognitive Mapping von Marken, d.h. Konzeptualisierung der Marke im Sinne der sozial geteilten semantischen Domäne, wurden die Teilschritte der Stimuluspräsentation, des Freelistings von Begriffen und deren Bewertung, sowie die Ähnlichkeitsanalyse mittels eines Triadentests unter balanced-incomplete-block-design- (BIBD)-Bedingungen in Fragebögen im Internet umgesetzt. Den Erhebungsanforderungen entsprechend wurden Stichproben in Höhe von N=60 online/N=51 offline für das Freelisting und N=32 online/N=16 offline für die Ähnlichkeitsanalyse mittels Triadentest gezogen.

Bevor die Ergebnisse der beiden Studien dargestellt werden, noch einige kurze Erläuterungen zum Konzept der semantischen Domäne - auch kulturelle oder sozial geteilte Domäne genannt. Eine kulturelle Domäne ist ein von einer Vielzahl der Angehörigen einer Kultur geteilter, nach ähnlichen Regeln strukturierter und abgegrenzter Wissensbereich. Beispiele für kulturelle Domänen:

- Emotionen, Verwandtschaftstermini, Tiere, Produktmarken eines Konsumgutes, Krankheiten, etc.

Weller & Romney (1988) definieren eine kulturelle Domäne wie folgt:
"A Domain may be defined as an organized set of words, concepts or sentences, all of the same level of contrast, that jointly refer to a single conceptual shere. The items in the domain derive their meaning, in part, from their position in a mutually interdependendent system reflecting the way in which a given language or culture classifies the relevant conceptual shere."

Borgatti (1998) verdeutlicht, was eine kulturell geteilte Domäne ist an folgendem Beispiel:
" If asked whether a tiger is an animal, the respondent feels that she is discussing a fact about the world outside, not about herself. In contrast, if she is asked whether "vanilla" is one of her favorite ice cream flavors, the respondent feels that she is revealing something about herself rather than about vanilla ice cream. In this sense, cultural domains are experienced as outside the individual and shared across individuals."

Um das Wissen, was zu einer kulturell geteilten Domäne gehört, zu erfassen, wurde ein Erhebungsverfahren entwickelt, dass auf einem Freelisting und einem Triadentest basiert. Nachstehend werden jeweils Anliegen und Vorgehen der beiden Erhebungsschritte beschrieben sowie die Ergebnisse der beiden bereits weiter oben erwähnten Studien dargestellt.

1. Freelisting
1.1 Vorgehen und Anliegen

Bezogen auf das Markenwissen könnte die Frage für die Freelists etwa lauten: "Bitte nennen Sie mir alle Begriffe, die Ihnen im Zusammenhang mit Idee-Kaffee bekannt sind." Das Ergebnis ist eine Liste mit den der Teilnehmer/in bekannten Termini. Um einen reliablen Eindruck von der Domäne zu bekommen, sollte man nicht nur eine, sondern mehrere (mindestens 15-20) Personen befragen. Das Ergebnis sind dann 15-20 solcher Listen. Die Häufigkeitsverteilungen der Begriffe geben eine erste Antwort auf die Frage, ob es sich um eine abgegrenzte Domäne handelt oder nicht. Drei Beispiele:

Im ersten Beispiel handelt es sich um keine Domäne, denn es gibt nicht einen Begriff, den alle (oder eine Mehrheit) der TeilnehmerInnen der Domäne zuordnen. In solchen Fällen liegt die Vermutung nahe, dass man Personen mit gänzlich unterschiedlichen Erfahrungen befragt hat. Sie verfügen über keinen "gemeinsamen Nenner" kultureller Überzeugungen. Der zweite Graph ist eine idealtypische Domäne. Es gibt ein Set von Begriffen, bei denen alle TeilnehmerInnen darin übereinstimmen, dass sie zu der Domäne gehören. Andere Begriffe werden nur von wenigen (möglicherweise ExpertInnen) genannt. Der dritte Graph kommt dem nahe, was man bei einer empirischen Erhebung antreffen sollte. Es gibt einen Bereich, der von allen geteilt wird, einen Mittelbereich und einen langen "Schweif" von individuellen Nennungen.

Welche Aussagen können aus den im Freelisting generierten Begriffslisten gewonnenen werden?
- Häufigkeiten der Begriffe
- Rangordnungen der Begriffe
- Gruppen von Begriffen
Darüber hinaus bilden die Begriffe aus dem Freelisting die Grundlage für den Triadentest. Dazu werden die am häufigsten genannten Begriffe ausgewählt. Um die Auswahl der Top- Begriffe zu erleichtern, kann zusätzlich eine Abfrage nach der Wichtigkeit der Begriffe erfolgen oder auch die Reihenfolge der Nennungen der Begriffe genutzt werden.

1.2 Ergebnisse aus Studien zum Cognitiven Mapping von Marken

Insgesamt wurden von den 60 online Befragten 206 Begriffe und von den 51 offline Befragten 193 Begriffe genannt. Nach einer Zusammenfassung der einzelnen Begriffe in inhaltlich identische Begriffsgruppen, z. B. wurden die Nennungen "voller Geschmack" und "geschmacksvoll" zusammengefasst, blieben jeweils 143 bzw. 144 Begriffsgruppen übrig. Bei der Erstellung der Ranglisten für die Top-15-Begriffe konnte festgestellt werden, dass in beiden Ranglisten 14 Begriffe identisch sind, lediglich die Rangplätze variieren leicht. (Für das Erstellen der Rangreihen wurden die Häufigkeit der Begriffsnennungen, die Wichtigkeit der Begriffe, die auf einer fünfstufigen Skala erfasst wurde, sowie die Reihenfolge der Begriffsnennung kombiniert.)

Die Ergebnisse zeigen für das Online-Freelisting den gleichen Umfang und die gleiche Reichhaltigkeit der Begriffe wie in der Offline-Untersuchung. Bekannte Nachteile des Verfahrens, wie Dubletten und Befragungssensibilität der Stichprobe, bleiben konstant.

2. Triadentest
2.1 Vorgehen und Anliegen

Der Triadentest wurde bereits während psychologischer Studien in den 50er Jahren entwickelt. Der Triadentest ist eine Erhebungsmethode, um auf direktem Wege Ähnlichkeiten zwischen einem Set von Begriffen zu generieren. Das Vorgehen ist sehr einfach: Man legt den TeilnehmerInnen eine Liste von Triaden - die aus den Top-Begriffen des Freelistings gebildet wurden - vor und bittet sie, denjenigen Begriff zu streichen, der von seiner Bedeutung her nicht zu den übrigen passt. Folgendes Beispiel aus der Tierwelt verdeutlicht die Logik:

o Löwe o Tiger o Möwe
o Möwe o Adler o Tiger

Die meisten deutschsprachigen TeilnehmerInnen dürften bei der ersten Triade wohl die "Möwe" als nicht dazugehörig und in der zweiten den "Tiger" als "irgendwie anders" klassifizieren. Vorteile des Triadentests sind: die Ergebnisse sind akkurat (valide) und sie sind zwischen den Befragten vergleichbar. Man kann also die kognitive Struktur einer jeden Teilnehmerin mit der einer anderen vergleichen. Der Triadentest besitzt jedoch auch einen wesentlichen Nachteil: er dauert i.d.R. länger und wird von den TeilnehmerInnen als nicht besonders "spannende" Aufgabe wahrgenommen. Darüber hinaus gibt es ein weiteres Problem beim Triadentest. Mit der Anzahl der Items/Begriffe wächst die Anzahl der Triaden nahezu exponential. Wenn 10 Begriffe zu der Domäne gehören, beträgt die Anzahl der Triaden somit 120, sind es 20 Begriffe, haben wir schon 1140 Triaden (etwa 20 DIN A4 Seiten). Um auch größer Anzahlen von Triaden bewältigen zu können, bedient man sich des sogenannten Balanced Incomplete Block Designs (BIBD). Dabei werden nicht alle möglichen Triaden abgefragt, sondern die Zahl der Kombinationen kann bei gleichbleibender Analysegenauigkeit gesenkt werden.

2.2 Umsetzung in Studien zum Cognitiven Mapping von Marken

Für die beiden Studien in Bereich Marken wurde entschieden, mit 15 Begriffen zu arbeiten. Die Zahl 15 für die auszuwählenden Begriffe ist keine zufällige Größe, sondern 15 Begriffe bilden eine marginale Menge, welche die TeilnehmerInnen im Gedächtnis gerade noch repräsentieren können. Auch ermöglichen 15 Begriffe eine ausreichend differenzierte Abbildung des Markenraumes. Ein BIB-Design besteht bei 15 Begriffen aus 35 Triaden, dabei wird jeweils ein Begriffspaar einmal abgefragt. Um Reliabilität zu erhöhen und auch Ermüdungseffekte konstant halten zu können, wurden die Triaden einerseits randomisiert dargeboten, andererseits hatten die TeilnehmerInnen jeweils zwei Designs (also insgesamt 70 Triaden) zu bearbeiten. D.h. jedes Begriffspaar konnte zweimal abgefragt werden.

Um die Reliabilität und Konstanz der Antworten zu prüfen wurde die Korrelation zwischen den beiden Designs berechnet: In der Offline-Befragung korrelierten die Designs mit r(16)=.673 (p<0.01) und in der Online-Befragung mit r(32)=.816 (p<0.01) hoch und signifikant.

3. Konsens
3.1 Vorgehen und Anliegen

Die Konsensusanalyse beruht auf drei theoretischen Annahmen. Wenn diese Annahmen nicht erfüllt sind (was man an den statistischen Ergebnissen sehen kann), kann sie nicht angewandt werden:

- Es handelt sich um "eine Kultur", d.h. alle TeilnehmerInnen haben tendenziell eine ähnliche Vorstellung von der Realität. Diese Annahme ist sicherlich nicht erfüllt, wenn man eine Gruppe von Teetrinkern über Eigenschaften und Geschmack von Idee-Kaffee befragt. Es dürfte schwer sein, hier Konsens und einen Experten zu finden.
- Unabhängigkeit: Alle TeilnehmerInnen beantworten die Fragen unabhängig voneinander.
- Die Triaden kommen aus einer Domäne: Sonst kann man die Kompetenzen nicht übertragen.
Anliegen der Konsensusanalyse ist es, aus der Übereinstimmung der Antworten der TeilnehmerInnen den Grad an kulturellem Wissen insgesamt zu ermitteln und das kulturelle Wissen einzelner TeilnehmerInnen zu induzieren. Es konnte nachgewiesen werden, dass die Übereinstimmung der Antworten eine Funktion des Wissens ist.

Aus der Übereinstimmung der TeilnehmerInnen kann demzufolge die "kulturell richtige" Antwort berechnet werden.

3.2 Ergebnisse aus Studien zum Cognitiven Mapping von Marken

Für beide Studien wurden die Konsenswerte berechnet. Der Konsenswert betrug im Mittel sowohl bei der Online- als auch bei der Offline-Erhebung 0,58 bzw. 0,60 und liegt damit auf akzeptablem Niveau.

Die Ergebnisse zeigen, dass auch intragruppale Konsenskennwerte im Vergleich der Online- zu der Offline-Erhebung nicht abfallen.

4. Korrespondenzanalyse
4.1 Vorgehen und Anliegen

Bis zu diesem Zeitpunkt haben wir uns damit beschäftigt, die Items einer Domäne zu identifizieren und Aussagen über die kulturelle Kompetenz der TeilnehmerInnen zu machen. Interessant sind jedoch auch die "lokalen" Strukturen der Begriffe in dieser Domäne. Für dieses Anliegen wird die Korrespondenzanalyse angewandt - ein statistisches Verfahren ähnlich einer multidimensionalen Skalierung, mit dem man die Dimensionen in der Domäne bestimmen kann. Diese Dimensionen bilden die Ordnungskriterien nach denen die Domäne strukturiert ist.

4.2 Ergebnisse aus Studien zum Cognitiven Mapping von Marken

Die mittels Korrespondenzanalyse visualisierten Ergebnisse der Ähnlichkeitsanalyse per Triadentest liefern ebenfalls gleiche Ergebnismuster für Online- und Offline-Daten. Auf eine Darstellung der Ergebnisse in Raumkoordinaten wird hier jedoch aus Platzgründen verzichtet. Es kann jedoch berichtet werden, dass in beiden Studien fünf Dimensionen erforderlich waren, um eine ausreichende Varianzaufklärung von 45,2% bei der Online- Erhebung bzw. 40,0% bei der Offline-Erhebung zu erreichen. Der Goodness-of-fit-Index, der als Maß für die Urteilerübereinstimmung berechnet wurde, erreichte Werte von durchschnittlich 0,6 online und 0,8 offline. Eine nennenswerte Unterscheidung zwischen beiden Untersuchungsmedien konnte daher nicht nachgewiesen werden.

5. Fazit

Die Daten lassen den Schluss zu, dass sich das Erhebungsverfahren unproblematisch online durchführen lässt und gleichzeitig eine Vereinfachung einhergeht (elektronisches Datenformat, Erhebung von großen Stichproben, Softwareunabhängigkeit, Motivierung der TeilnehmerInnen). Dies stellt eine solide Grundlage für eine weitere Verbreitung modellfreier Erhebungsverfahren beispielsweise in der Marktforschung dar.

6. Literatur

Borgatti, S.P. (1998). Elicitation Methods for Cultural Domain Analysis. In: J. Schensul & M. LeCompte (Ed.) The Ethnographer's Toolkit. Volume 3. Walnut Creek: Altamira Press.

Romney, A.K., Weller, S.C. & W.H. Batchelder (1986). Culture as consensus: A theory of culture and informant accuracy. American Anthropologist 88, S. 313-338.

Weller, S.C. & A.K. Romney (1988). Systematic Data Collection. Newbury Park, CA: Sage Publications.


Müller-Peters, Anke ; Kern, Oliver ; Geißler, Holger Institution: imafo GmbH, Bochum
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Die Wirkungsweise unterschiedlicher Incentivierungssysteme auf Rekrutierungserfolg und Stichprobenqualität."


Musch, Jochen ; Ehrenberg, Katja; Mierke, Jan Institution: Psychologisches Institut, Rheinische Friedrich-Wilhelms-Universität Bonn
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Web-Experimente zum ersten Eindruck in der Personenwahrnehmung."


Naumann, Johannes ; Institution: Psychologisches Institut, Universität zu Köln
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Kontexteffekte bei der Online-Messung computerbezogener Einstellungen."


Neuhaus, Christoph ; Kaufmann, Esther ; Reips, Ulf-Dietrich Institution: Universität Zürich
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Lehren mit Flash: eine WWW-basierte Lerneinheit zum Web-Experimentieren."


Neuroth, Heike ; Institution: Niedersächsische Staats- und Universitätsbibliothek, Göttingen
Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
view preliminary article - edit preliminary article - upload an image(for authors only)
"Suche im Internet hoffnungslos? Konzepte zur Erschließung fachrelevanter wissenschaftlicher Internet-Angebote."


Noller, Stephan ; Naumann, Johannes ; Richter, Tobias ; Institution: humanIT GmbH, St. Augustin
Article (version: 25/06/2002 - 07:47, size: 25643)
"LOGPAT – ein webbasiertes Tool zur Analyse von Navigationsverläufen in Hypertexten."
German: LOGPAT-ein webbasiertes Tool zur Analyse von Navigationsverläufen in Hypertexten

Logfiles sind automatisch erstellte Interaktionsprotokolle, in denen eine Reihe von Merkmalen des Umgangs von Nutzer/innen mit lokalen und web-basierten Computeranwendungen aufgezeichnet werden können. Das in diesem Beitrag vorgestellte Software-Tool LOGPAT (Logfile Pattern Analysis) ist insbesondere auf die Analyse von Navigationsverläufen bei der Nutzung von hypertextuell strukturierten Informationsangeboten zugeschnitten. Hypertexte sind dadurch gekennzeichnet, daß Rezipienten/innen ein vergleichsweiser großer Spielraum bei der Auswahl und Sequenzierung von Informationen eingeräumt wird (Gerdes, 1997). In der Literatur werden entsprechend eine Reihe allgemeiner Nutzungsstrategien wie zielgerichtete Suche (directed search), zweckgebundenes "Stöbern" (general purpose browsing) oder "entdeckendes Stöbern" (serendipitous browsing) unterschieden (Cove & Walsh, 1988; Marchionini, 1989). Je nach Fragestellung und Aufbau des zugrundeliegenden Hypertexts lassen sich Navigationsverläufe zudem z. B. danach klassifizieren, inwieweit die Rezeption linear oder nicht-linear verläuft, sich an der hierarchischen Struktur eines Hypertexts orientiert oder von Backtracks und Navigationshilfen Gebrauch macht (vgl. Flender & Naumann, in Druck). In vielen Forschungskontexten stellt sich aber auch einfach die konkrete Frage, welche Inhalte überhaupt in welcher Reihenfolge rezipiert worden sind. Aus dem Navigationsverhalten einer hinreichenden Zahl von Nutzern/innen kann im übrigen auf Eigenschaften des Hypertexts (z. B. im Hinblick auf Usability-Gesichtspunkte) geschlossen werden.

Logfiles bieten sehr reichhaltige Informationen zur Ableitung vielfältiger Merkmale von Navigationsverläufen und können sowohl online als auch offline erhoben werden. Im World Wide Web (WWW) wird beispielsweise von jedem Server standardmäßig ein Logfile erstellt, das Seitenaufrufe, Datum und Uhrzeit des Aufrufs, Browsertyp, verweisende Seiten, Informationen über die Identität von Nutzer/innen (z. B. die IP-Adresse) und andere Daten enthält (vgl. z. B. Janetzko, 1999). Über einen Proxy-Server lassen sich auch clientseitig Logfile-Daten erheben. Offline werden Logfiles häufig dann eingesetzt, wenn Rezeptionsprozesse und Interaktionen von Lernenden bei der Rezeption lokal dargebotener Hypertext- und Hypermedia-Anwendungen erfaßt werden sollen (Flender & Naumann, in Druck). LOGPAT ist ursprünglich für den Einsatz in einem Projekt zum Vergleich der Lerneffizienz von linearem Text und Hypertext unter verschiedenen Verarbeitungszielen entwickelt worden (vgl. Christmann, Groeben, Flender, Naumann & Richter, 1999). Eine primäre (aber nicht ausschließliche) Anwendungsmöglichkeit von LOGPAT besteht daher in der Extraktion von Kennwerten, mit denen sich das individuelle Navigationsverhalten in hypertextuell strukturierten Lehr-Lern-Anwendungen zusammenfassend beschreiben läßt.

Wozu ein neues Tool zur Logfile-Analyse?

Abgesehen von bislang nicht befriedigend lösbaren Problemen bei online und WWW-öffentlich erhobenen Logfiles – vor allem Schwierigkeiten bei der Zuordnung von Nutzungsdaten zu individuellen Nutzer/innen und Datenausfälle durch Caching (vgl. z. B. Pitkow, 1997) - stellen Logfiles eine sehr zuverlässige Methode der Datenerhebung dar. Gegenüber alternativen Methoden wie Video-Aufzeichnungen (z. B. Chang & McDaniel, 1995) oder der manuellen Protokollierung von Seitenbesuchen bzw. Nutzeraktionen (z. B. Wandke & Hurtienne, 1999) zeichnen sich Logfiles durch eine hohe Ökonomie und Objektivität sowie eine niedrige Reaktivität aus. Zudem enthalten sie eine Fülle von Daten, die im Hinblick auf Charakteristika individueller Navigationsverläufe oder die Usability des betrachteten Hypertexts interpretiert werden können. Allerdings sind diese Informationen in den Logfiles nicht unmittelbar zugänglich. Insbesondere bei stark vernetzten Hypertexten mit zahlreichen Knoten und bei großen Stichproben von Nutzern/innen sind die anfallenden Logfiles umfangreich und unübersichtlich, was je nach Untersuchungsziel verschiedene Methoden der Datenreduktion erforderlich macht. Die zahlreichen kommerziell oder frei verfügbaren Tools zur Logfile-Analyse liefern dabei in der Regel lediglich grobe Statistiken bezogen auf Webpages oder Websites im Ganzen, erlauben aber kaum detaillierte Aussagen über die Navigationsverläufe einzelner Nutzer/innen. Ausnahmen bilden Programme für graphentheoretische Analysen (Niegemann, 1997; Rauterberg, 1996), die jedoch jeweils vor dem Hintergrund bestimmer theoretischer Perspektiven und Anwendungsbereiche nur einen eng umgrenzten Ausschnitt von Analyse- und Anwendungsmöglichkeiten bieten. LOGPAT ist demgegenüber mit dem Ziel entwickelt worden, eine gewisse Bandbreite der in der Literatur bislang vorgeschlagenen Kennwerte zur Beschreibung des individuellen Navigationsverhaltens in einer einfach zu handhabenden Analyseumgebung verfügbar zu machen. Die Analyseoptionen können dabei flexibel an die jeweilige Fragestellung und das Format des verfügbaren Datenmaterials angepaßt werden.

Logfile-Analysen des Navigationsverhaltens in Hypertexten

Die in der Hypertextforschung üblicherweise verwendeten Kennwerte zur Charakterisierung des individuellen Navigationsverhaltens lassen sich in drei Klassen gliedern. Atomistische Kennwerte beziehen sich auf die Nutzung einzelner Seiten oder Seitentypen, mit sequenzanalytischen Kennwerten werden definierte Folgen von Seitenaufrufen abgebildet, und auf der Basis von Distanzmatrizen lassen sich zusammenfassende Indizes für ganze Navigationsverläufe geben. Mit LOGPAT können Maße aus allen drei Gruppen gebildet werden.

  • Atomistische Kennwerte. Nicht zuletzt wegen ihrer leichten Ermittelbarkeit sind Maße, die sich auf die Nutzung einzelner Seiten oder Seitentypen beziehen, in der Hypertextforschung sehr weit verbreitet. Neben der Häufigkeit, mit der bestimmte Knoten (z. B. die für eine Aufgabenstellung unmittelbar relevanten Seiten) aufgerufen werden, wird oft der Anteil bestimmter Seitentypen (z. B. Überblicks- vs. Inhaltsseiten, Navigationshilfen) oder die dort insgesamt verbrachte Zeit herangezogen (vgl. Barab, Bowdish, Young & Owen, 1996; Gay, Trumbull & Mazur, 1991; Lawless & Kulikowich, 1996; McDonald & Stevenson, 1998).
  • Sequenzanalytische Kennwerte. Im Vergleich zu atomistischen Kennwerten können sequenzanalytische Maße als aussagekräftigere Indikatoren für Navigationsstrategien gelten, da sie ganze Folgen von Seitenaufrufen abbilden. In Untersuchungen zum Lernen mit Hypertext werden gelegentlich die Häufigkeit linearer vs. nicht-linearer Navigationssequenzen, die Häufigkeit von Backtracks oder von Sequenzen betrachtet, bei denen hierarchiehöhere Seiten (etwa Überblickseiten) zum Wechsel in eine andere Substruktur des Hypertexts verwendet werden (vgl. z. B. Schroeder & Grabowski, 1995; Verheij, Stoutjesdijk & Beshuizen, 1996). Analysen dieser Art sind natürlich (mit Ausnahme der Backtracks) nur bei Hypertexten mit einer bestimmten Knoten-Link-Struktur möglich. Das von Crow und Smith (1992) vorgeschlagene Pattern Detection Module erlaubt dagegen die Identifikation beliebiger Knotensequenzen (oder Navigationspfade) einer vorgebbaren Länge und registriert die Häufigkeit des Auftretens dieser Sequenz während einer Nutzersession. Einfache Sequenzmuster dieser Art sind eine wesentliche Datenquelle im Web Mining, wobei es allerdings weniger um eine Beschreibung individueller Unterschiede in Navigationsverläufen als vielmehr um die Vorhersage von Seitenbesuchen geht (vgl. z. B. Cooley, Mobasher & Srivastasa, 1999; Pitkow & Pirolli, 1999).
  • Kennwerte auf der Basis von Distanzmatrizen. Für die Repräsentation von Navigationsverläufen in Matrixform gibt es verschiedene Möglichkeiten. Zweckmäßigerweise werden nicht-symmetrische Matrizen verwendet, in denen die Knoten zeilenweise als Ausgangsknoten und spaltenweise als Zielknoten eines Navigationsschritts notiert werden (oder umgekehrt). Die Zellen einer Übergangsmatrix enthalten die direkten Übergänge von einem Knoten zu einem anderen (vgl. Niegemann, 1997; vgl. auch das Konzept des State-Transition-Vektors bei Rauterberg & Fjeld, 1998). In Distanzmatrizen, wie sie von Botafogo, Rivlin und Shneiderman (1992) zunächst zur strukturellen Beschreibung von Hypertexten vorgeschlagen worden sind, wird auch die in einem gegebenen Logfile benötigte Zahl von indirekten Navigationsschritten von einem Knoten zum anderen notiert (McEneaney, 1999; für eine alternative Methode zur Ermittlung von Knotendistanzen vgl. Reitsma & Buttenfield, 1999). Aus Distanzmatrizen dieser Art lassen sich verschiedene zusammenfassende Kennwerte ableiten, insbesondere die standardisierten Maße Compactness (Kompaktheit) und Stratum (Schichtung) zur Beschreibung der Vernetztheit bzw. Linearität eines Navigationspfades (vgl. Botafogo et al., 1992). Distanzmatrizen bieten zudem eine gute Datenbasis für den Vergleich und die Gruppierung von Navigationsverläufen verschiedener Nutzer/innen mittels entsprechender statistischer Verfahren.

Programmbeschreibung

LOGPAT wurde als interaktive Webanwendung realisiert. Dadurch ist es möglich, daß gleichzeitig mehrere Benutzer/innen Analysen durchführen. Die jeweiligen Analysebereiche sind durch eine Benutzerverwaltung voneinander abgetrennt.

Auf den Arbeitsstationen muß durch dieses Design nur ein herkömmlicher Web-Browser installiert sein. Der Aufruf des Programms und die Interaktion geschehen ausschließlich über das Browser-Interface.

Programmiersprache

Als Programmiersprache wurde PHP (PHP-Hypertext-Preprocessor), eine leicht erlernbare Sprache für dynamische Webanwendungen, angewandt. PHP ist eine frei verfügbare Systemerweiterung für Webserver und auf zahlreichen verschiedenen Servertypen implementierbar. Da es sich bei PHP um ein klassisches Open-Source-Projekt handelt, ist die Unterstützung insbesondere für Anfängern/innen durch zahlreiche Mailinglisten, Newsgroups und spezielle Webseiten hervorragend. Damit ist eine individuelle Anpassung des Programms und die Weiterentwicklung leicht möglich. Es wird dringend empfohlen, eine PHP-Version ab 4.x zu verwenden, da ältere Versionen die erforderlichen Rechenoperationen deutlich langsamer ausführen.

Systemanforderungen

Um zügig mit dem Programm arbeiten zu können, sollte ein entsprechender Server-Rechner verwendet werden. Da es sich bei einigen Analyseoptionen um – insbesondere bei großen Logfiles – sehr rechenintensive Auswertungen handelt, sollte ein ausreichend hoch getakteter Prozessor und ausreichend Arbeitsspeicher eingeplant werden. Beim Festplattenspeicherplatz sind die Anforderungen hingegen sehr gering.

Format des Dateninputs

In der Regel liegen Logfiles als strukturierte Textdateien vor. Logpat kann beliebige derartige Textdateien einlesen und verarbeiten, wobei davon ausgegangen wird, daß pro Zeile eine Seitenbezeichnung eingelesen werden kann. Weitere Informationen, wie z.B. Zeitstempel müssen entfernt werden. Dazu wird eine Konvertierfunktion angeboten, die beliebige Zeichenkombinationen (Regular Expressions) aus den Logfiles herausfiltern kann. Zusätzlich gibt es die Möglichkeit, Kriterien anzugeben, nach denen bestimmte Zeilen von der Analyse ausgeschlossen werden sollen.

Für die Analyse atomistischer Kennwerte kann eine Textdatei eingelesen werden, die pro Zeile ein Suchmuster enthält. Dieses Patternfile steht dann systemweit zur Verfügung und kann in alle Analysen einbezogen werden. Auch hier können Muster nach der Syntax der Regular Expressions verwendet werden.

Viele Analysemöglichkeiten legen es nahe, daß für jede Versuchsperson jeweils eine Logfile zur Verfügung steht. Dies ist aber nicht immer selbstverständlich, und sollte zu Beginn der Untersuchung sichergestellt werden.

Outputformate

Neben der Ausgabe der Kennwerte am Bildschirm in Form von Tabellen und Graphiken besteht die Möglichkeit, die Ergebnisse der Multifile-Analyse als CSV (Comma-Separated-File) oder SPSS-kompatible DAT-Datei herunterzuladen.

Programmstruktur

  • Single File-Analyse
  • Die Single File-Analyse soll verwendet werden, um einzelne Logfiles näher zu analysieren. Eine einzelne Logfile kann hier nach atomistischen Kennwerten durchsucht werden, wobei sowohl die freie Eingabe eines individuellen Musters als auch die Verwendung des systemweiten Patternfiles möglich ist. Die Häufigkeiten für diese Muster werden für die Seitenaufrufe und für aktuelle analysierte Sequenzen getrennt errechnet.

    Gleichzeitig kann die Logfile nach Sequenzen einer definierten Länge (Anzahl von Seiten) durchsucht werden. Diese Sequenzen werden tabellarisch mit der jeweiligen Häufigkeitsangabe ausgegeben, wobei die Anzeige singulär auftretender Sequenzen unterdrückt werden kann. Folgende zusätzliche Kennwerte für Sequenzen werden ausgegeben:

    • linear; gibt an ob es sich um eine lineare Sequenz handelt (z.B. "Visu01è Visu02è Visu03")
    • backtrack; gibt an ob es sich um eine backtrack-Sequenz handelt (z.B. "Visu01è Visu02è Visu01")
    • innerhalb; gibt an ob die Sequenz sich innerhalb eines bestimmten Teilbereiches bewegt (z.B. "Visu07è Visu01è Visu05")

    Abgesehen von backtrack muß Logpat bei der Errechnung dieser Kennwerte auf die individuellen Logfiles der jeweiligen Analyse eingestellt werden. Dies kann momentan nur durch Veränderung des Programmcodes geschehen. Die Voreinstellungen gehen von einem Seitenmuster aus vier Buchstaben und zwei Ziffern aus, wie es z.B. von Toolbook-Anwendungen generiert wird.

    Zur graphentheoretischen Analyse der Logfile ist es möglich, eine Distanzmatrix ausgeben zu lassen. Die Distanzmatrix eignet sich gut, um einzelne Seiten im Zusammenhang der gesamten Logfile beurteilen zu können. Dazu werden diverse Kennwerte ausgegeben, vor allem aber die Relative In-Centrality (RIC) und Relative Out-Centrality (ROC). Da diese Matrix bei größeren Logfiles schnell unübersichtlich wird, ist es möglich, ihre Ausgabe zu unterbinden und nur die Kennwerte Stratum und Compactness ausgeben zu lassen. Um alternative Berechnungsmöglichkeiten zur Verfügung zu stellen ist es möglich den Faktor k, der bei der Errechnung der Distanzmatrix eine entscheidende Rolle spielt (als Platzhalter für "unendliche" Knotendistanzen, vgl. Botafogo et al., 1992), manuell vorzugeben. Per Voreinstellung wird dieser Wert mit der Anzahl der analysierten Seiten gleichgesetzt.

    Um die Analyse den individuellen Bedürfnissen anzupassen, ist der Analysebereich hinsichtlich zweier Dimensionen beeinflußbar. Es kann sowohl die Anzahl der Zeichen pro Seite, die in die Analyse einbezogen werden, (z.B. sollen nur die ersten vier Zeichen verwendet werden: "Visuè Visu") als auch der Analysebereich der jeweiligen Logfile eingeschränkt werden (z.B. nur die ersten 10 Zeilen).

    1. Multifile-Analyse

    Der Grundgedanke der Multifile-Analyse ist es, die wesentlichen Funktionen der Single-File-Analyse zur Verfügung zu stellen, zugleich aber die simultane Verarbeitung mehrerer Logfiles in einem Arbeitsschritt zu ermöglichen. So können die relevanten Kennwerte schnell im Überblick beurteilt werden, um z. B. Auffälligkeiten einzelner Logfiles zu erkennen. Diese können dann wiederum in die Single File-Analyse übernommen werden.

    Hier stehen im wesentlichen die gleichen Kennwerte wie in der Single File-Analyse zur Verfügung, allerdings werden die Sequenzen nicht individuell ausgegeben, sondern nur kumulierte Kennwerte tabellarisch dargestellt. Ebenso kann die Musteranalyse mit dem Pattern-File vorgenommen werden.

    Für die graphentheoretische Analyse werden hier nur die Kennwerte Compactness und Stratum ausgegeben.

    Anders als in der Single File-Analyse gibt es zusätzlich die Möglichkeit, standardisierte Werte auszugeben (die Werte werden an der Anzahl von Seiten der jeweiligen Logfile standardisiert).

    Um Teilbereiche zu analysieren, kann hier ein Wert angegeben werden, welcher verwendet wird, um die zu analysierenden Logfiles in Sequenzen gleicher Länge aufzuspalten und Kennwerte für diese Teilsequenzen auszugeben.

    Um heuristische Analysen zu erleichtern, wurde zusätzlich die Option einer graphischen Visualisierung der Ergebnisse implementiert.

    Neben einer tabellarischen Ausgabe der Kennwerte können die Ergebnisse der Multifile-Analyse als CSV- oder SPSS-DAT-File heruntergeladen werden.

    Programmverfügbarkeit

    Das Programm ist unmittelbar nach der Konferenz unter der WWW-Adresse http://www.log-pat.de verfügbar. Unter dieser Adresse wird es die Möglichkeit geben, mit einem Gastaccount Testanalysen durchzuführen. Für die Arbeit mit dem Programm ist es dann sinnvoll, sich entweder einen persönlichen Account einrichten zu lassen oder das Programm herunterzuladen und auf dem eigenen Server zu installieren.

    Die o.g. Seite soll auch dazu dienen, die Weiterentwicklung des Programms zu dokumentieren und zu koordinieren.

    Logpat wird unter der GNU General Public License (GPL) freigegeben und steht interessierten Personen somit kostenlos zur Verfügung.

    Diskussion und Ausblick

    LOGPAT wurde im Rahmen eines Forschungsprojekts zur Aufbereitung und präliminarischen Auswertung der anfallenden Logfile-Daten entwickelt und eingesetzt. Von einer umfassenden Lösung zur Logfile-Analyse ist es daher weit entfernt. Wir verstehen es eher als Baustein in einem solchen Analyseprozeß und haben versucht, diesem Umstand z.B. durch flexible Exportmöglichkeiten Rechnung zu tragen.

    Andererseits ist schon jetzt eine gewisse Bandbreite und vor allem eine hohe Flexibilität in der Anwendung gegeben, so daß für die Weiterentwicklung des Tools ein gute Ausgangslage besteht. Wir haben LOGPAT auch deshalb unter der GPL-Lizenz freigegeben, weil wir uns eine kontinuierliche Weiterentwicklung durch andere Forscher/innen-Gruppen erhoffen, die sich mit ähnlichen Fragestellungen beschäftigen.

    Anmerkung

    LOGPAT wurde im Rahmen des von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projekts "Verarbeitungsstrategien bei klassischen (linearen) Buchtexten und zukünftigen (nicht-linearen) Hypertexten" (Leitung: PD Dr. Ursula Christmann und Prof. Dr. Norbert Groeben) entwickelt. Wir danken der DFG für ihre Unterstützung. Wir danken weiterhin Nadine van Holt für ihre Hilfe bei der Erprobung und dem Bug-Fixing.

    Literatur

    Barab, S. A., Bowdish, B. E., Young, M. F. & Owen, S. V. (1996). Understanding kiosk navigation: Using log files to capture hypermedia searches. Instructional Science, 24, 377-395.

    Botafogo, R. A., Rivlin, E. & Shneiderman, B. (1992). Structural analysis of hypertexts: Identifying hierarchies and useful metrics. ACM Transactions on Information Systems, 10, 142-180.

    Chang, C & McDaniel, E. D. (1995). Information search strategies in loosely structured settings. Journal of Educational Computing Research, 12, 95-107.

    Christmann, U., Groeben, N., Flender, J., Naumann, J. & Richter, T. (1999). Verarbeitungsstrategien von traditionellen (linearen) Buchtexten und zukünftigen (nichtlinearen) Hypertexten. In N. Groeben (Hrsg.), Lesesozialisation in der Mediengesellschaft. Ein Schwerpunktprogramm (10. Sonderheft IASL) (S. 175 – 189). Tübingen: Niemeyer.

    Cooley, R., Mobasher, B., Srivastasa, J. (1999). Data preparation for mining world wide web browsing patterns. Knowledge and Information Systems, 1, 5-32.

    Cove, J. F. & Walsh, B. C. (1988). Online text retrieval via browsing. Information Processing and Management, 24, 31-37.

    Crow, D. & Smith, B. (1992). DB_habits: Comparing minimal knowledge and knowledge-based approaches to pattern recognition in the domain of user-computer interactions. In R. Beale & J. Finley (Eds.), Neural networks and pattern recognition in human computer interaction (pp. 39-61). New York, NY: Ellis Horwood.

    Flender, J. & Naumann, J. (in Druck). Erfassung allgemeiner Lesefähigkeiten und der Rezeption nicht-linearer Texte: "PL-Lesen" und Logfile-Analyse. In N. Groeben & B. Hurrelmann (Hrsg.), Lesekompetenz. Weinheim: Juventa.

    Gay, G., Trumbull, D. & Mazur, J. (1991). Designing and testing navigational strategies and guidance tools for a hypermedia program. Journal of Educational Computing Research, 7, 189-202.

    Gerdes, H. (1997). Lernen mit Text und Hypertext. Lengerich: Pabst.

    Janetzko, D. (1999). Statistische Anwendungen im Internet: Daten in Netzwerkumgebungen erheben, auswerten und präsentieren. München: Addison-Wesley.

    Lawless, K. A. & Kulikowich, J. M. (1996). Understanding hypertext navigation through cluster analysis. Journal of Educational Computing Research, 14, 385-399.

    Marchionini, G. (1989). Information-seeking strategies of novices using a full-text electronic encyclopedia. Journal of the American Society for Information Science, 40, 54-66.

    McDonald, S. & Stevenson, R. J. (1998). Navigation in hyperspace: An evaluation of the effects of navigational tools and subject matter expertise on browsing and information retrieval in hypertext. Interacting with Computers, 10, 129-142.

    McEneaney, J. E. (1999). Visualizing and assessing navigation in hypertext. Proceedings of the 10th ACM Conference on Hypertext and Hypermedia (Hypertext '99) (pp. 61-70). New York, NY: Association for Computing Machinery.

    Niegemann, H. M. (1997). Verläufe selbstkontrollierten mediengestützten Lernens: Zur Entwicklung eines computerbasierten Analyseverfahrens. Unveröffentl. Manuskript, Universität Mannheim.

    Pitkow, J. & Pirolli, P. (1999). Mining longest repeating subsequences to predict World Wide Web surfing. Proceedings of USITS '99: The 2nd USENIX Symposion on Internet Technologies & Systems. Boulder, CO.

    Pitkow. J. (1997). In search of reliable usage data on the WWW. Proceedings of the Sixth International WWW Conference (pp. 451-463). Santa Clara, CA.

    Rauterberg, M. (1996). A Petri net based analyzing and modeling tool kit for logfiles in human-computer interaction. In H. Yoshikawa & E. Hollnagel (Eds.), Proceedings of Cognitive Systems Engineering in Process Control CSEPC '96 (pp. 268-275). Kyoto: Kyoto University, Graduate School of Energy Science.

    Rauterberg, M. & Fjeld, M. (1998). Task analysis in Human-Computer-Interaction: Supporting action regulation theory by simulation. Zeitschrift für Arbeitswissenschaft, 52, 152-161.

    Reitsma, R. F. & Buttenfield, B. P. (1999). Inductive explorations of information space geography. In W. D. Haseman & D. L. Nazareth (Eds.), Proceedings of America's Conference on Information Systems AMCIS (pp. 277-279). Milwaukee, WI.

    Schroeder, E. E. & Grabowski, B. L. (1995). Patterns of exploration and learning with hypermedia. Journal of Educational Computing Research, 13, 313-335.

    Verheij, J., Stoutjesdijk, E. & Beishuizen, J. (1996). Search and study strategies in hypertext. Computers in Human Behavior, 12, 1-15.

    Wandke, H. & Hurtienne, J. (1999). Zum Navigationsverhalten von Erstbenutzern des Worl Wide Web [Online Document]. Available URL: http://arb1.psychologie.hu-berlin.de/ingpsy/publikationen/navigation.html


    Noller, Stephan ; Institution: humanIT GmbH, St Augustin
    Article (version: 25/06/2002 - 07:47, size: 24608)
    "Navigation in komplexen Hypertextsystemen – ein Webexperiment mit unterschiedlichen Visualisierungstools."
    German:

    Navigation in komplexen Hypertextsystemen

    Ein Navigationsexperiment zur Informationssuche im World-Wide Web

    Stephan Noller

    humanIT
    Rathausallee 10
    Sankt Augustin

    +49 2241 92926 44

    noller@humanit.com

    ABSTRACT

    In einem Webexperiment wurde der Nutzen zusätzlicher Visualisierungstechniken bei der Navigation in einer komplexen Website untersucht. Drei Bedingungen wurden realisiert: Neben der unveränderten Site des deutschen Bundestages wurde die Site in einem Fall in einem zusätzlichen Fenster durch ein hierarchisches Inhaltsverzeichnis dargestellt. Im anderen Fall wurde die Darstellung der Website vollständig durch das Visualisierungstool Hyperbolic-Tree ersetzt, wobei mit Hilfe von fisheye-Technik und speziellen Verzerrungen gleichzeitig alle Knoten am Bildschirm sichtbar waren. Zusätzlich konnte in interessierende Bereiche hineingezoomt werden. Im Rahmen des Experiments sollten Fragen zur Website beantwortet werden. Zusätzlich wurden spatial ability und ein Usability-Rating erhoben. 185 Versuchspersonen nahmen am Webexperiment teil.

    Entgegen den Erwartungen erwies sich die aufwändige Visualisierung durch den Hyperbolic-Tree als nicht vorteilhaft, und zwar sowohl hinsichtlich objektiver Maße (Lösungsgüte und Bearbeitungszeit) als auch in der Usability-Beurteilung; zudem ergab sich ein selektiver Dropout, ebenfalls zuungunsten des Hyperbolic Tree.

    Einleitung

    Die Visualisierung umfangreicher Datenmengen ist eines der Grundprobleme der HCI. Im Laufe der Zeit wurden zahlreiche Programme und Tools entwickelt, die jeweils helfen sollen, Navigation und Retrieval in umfangreichen information landscapes zu verbessern. Dabei kommt den Ansätzen, die mit fisheye-Technik versuchen möglichst viel Informationen bei Erhaltung der Kontextinformationen auf den Bildschirm zu bekommen besondere Bedeutung zu.

    Mit der vorliegenden Studie soll vor diesem Hintergrund die klassische Frage des vielzitierten CHI97-Browse-Off nochmals aufgegriffen werden, indem direkt im Web anhand einer realen Website zwei Tools gegeneinander antreten sollen, die in vielfacher Hinsicht einen unterschiedlichen Ansatz bei der Visualsierung realisieren: WebToc (Nation, 1998) und Hyperbolic Tree (Inxight; Lamping, Rao & Pirolli, 1995).

    Die Untersuchung

    Vorgehen

    Die Studie erfolgte als unbeaufsichtigtes Online-Experiment im WWW. Nachdem die Versuchspersonen auf der Startseite kurz über den Kontext der Untersuchung und deren Ziele aufgeklärt wurden, erfolgte die randomisierte Zuweisung zu einer der Navigationsbedingungen, ohne Hilfe, WebToc oder Hyperbolic-Tree. Dann folgte über zwei weitere Seiten eine Einführung in das Experiment und ein kurzes Tutorial zur Bedienung des jeweiligen Tools (nur in den Bedingungen WebToc und Hyperbolic-Tree). Nach dieser Eingangsphase wurde die WebSite des Deutschen Bundestages im Fullscreenmodus präsentiert und die erste Frage in einem separaten Bereich eingeblendet. Nach Beantwortung dieser Fragen wurden zusätzliche Aufgaben zur Erhebung der spatial ability, ein Usability-Fragebogen (CSUQ; Lewis 1995) und einige weitere Fragen zum Experiment sowie zur Person zur Beantwortung angeboten.

    Zum Abschluß der Untersuchung bestand die Möglichkeit einer offenen Rückmeldung und es wurde eine individuelle Ergebnisrückmeldung präsentiert.


    Versuchspersonen

    An der Untersuchung nahmen innerhalb eines Monates 414 Personen teil, wovon 229 zu einem frühen Zeitpunkt die Teilnahme abbrachen. Es resultierten infolgedessen 185 Datensätze, die in die Analysen einbezogen werden konnten. Da für die Abbrecher ebenfalls eine Reihe von Kenndaten vorlagen, konnten diese einer separaten Analyse unterzogen werden.

    Die Zusammensetzung der Stichprobe war hinsichtlich des Geschlechter-Verhältnisses vergleichbar mit aktuellen größeren Untersuchungen zur Zusammensetzung der Population der Internetuser im deutschsprachigen Raum (Table 1). Im Durchschnitt gaben die Teilnehmer an, das Internet seit 4.5 Jahren und mit einem Zeitaufwand von 12.8 Stunden pro Woche zu nutzen, was auf eine Stichprobe mit überdurschnittlich hoher Internet-Expertise hindeutet.

    Table 1: Soziodemographische Kennwerte der Stichprobe im Vergleich mit anderen Studien

    Study

    Own (2000)

    ARD/ENIGMA (2000)

    Forsa (2000)

    Sample Size

    185

    1000

    11003

    Usage:
    hrs/week

    12,8

    9,6

    6,3

    Usage:
    years

    4,5

    2,3

    1,7

    Gender % (m/f)

    67/32

    65/35

    68/31

     

    Material

    Das Experiment wurde mit einer Kopie der Website des Deutschen Bundestages durchgeführt. Da Hyperbolic Tree mit der Darstellung der ursprünglichen ca. 13000 Seiten technische Probleme verursachte, wurde die Site so bearbeitet, daß schließlich nur noch 3474 einzelne html-Dateien darzustellen waren. In der Control-Bedingung wurde die Site ohne weitere Änderungen präsentiert, in den beiden Tool-Bedingungen den Anforderungen des Tools entsprechend (s.u.).

    <

    Die eingesetzten Visualisierungstools

    WebToc

    WebToc wurde 1997 von David Nation an der Universität Maryland entwickelt (Nation, 1998; Nation, Plaisant, Marchionini & Komlodi, 1997).

    Das Programm stellt den Inhalt der zugrundeliegenden WebSite in der Form eines hierarchischen Inhaltsverzeichnisses dar, dessen Kategorien auf- und zugeklappt werden können. Als zusätzliche Funktionen kann dieses Inhaltsverzeichnis recherchiert werden, und weitere Informationen über die Anzahl von Dateien in einem Unterverzeichnis (=einer Kategorie) und deren Größe werden mit farbigen Balken angezeigt (vgl. Abbildung 3).

    Die Grundlage dieser Darstellung ist die Dateistruktur der Dateien auf dem Webserver, die über ein mitgeliefertes Java-Programm analysiert und in entsprechender Form abgespeichert wird.

    In der Implementation des Programmes wird in der Regel eine Aufteilung des Bildschirms in ein kleineres linkes Fenster, welches "WebToc" enthält und ein größeres rechtes Fenster, in welchem die jeweiligen Seiten der Web-Site dargestellt werden, realisiert (so auch in dieser Untersuchung).

    Hyperbolic Tree

    Der Hyperbolic-Tree-Browser wurde in den Xerox-Forschungslaboratorien entwickelt und erstmals 1995 der Öffentlichkeit vorgestellt (Lamping & Rao, 1996; Lamping, Rao & Pirolli, 1995).

    Das Programm versucht das Problem von Fokus und Kontext bei großen Mengen (hierarchischer) Informationen zu lösen, indem die im Fokus liegenden Objekte (oder Knoten) zentral, gleichzeitig aber alle anderen vorhandenen Informationen und deren Vernetzungsstruktur dargestellt werden. Dies wird durch eine zunehmende visuelle Kompression der entfernt liegenden Knoten erreicht - ein Prinzip das erstmals von Furnas (1986) als "fisheye-view" beschrieben wurde. Theoretisch liegt dieser Art der Darstellung komplexer Hierarchien ein Abkehr von Prinzipien der Euklidischen Geometrie zugunsten der hyperbolischen Geometrie zugrunde (vgl. Lamping, Rao & Pirolli, 1995).

    Der Fokus kann dabei einfach per Mausklick auf das interessierende Objekt geändert werden. In diesem Fall wird der Wechsel in die neue Konfiguration mit einem animierten Übergang dargestellt, um das Phänomen des Orientierungsverlusts zu vermeiden ("animated transition between different views of a structure can maintain object constancy an help the user assimilate the changes across views", a.o., S. 8). Als weitere Maßnahme gegen dieses Phänomen wurden spezielle Mechanismen in den Darstellungsalgorhithmus eingebaut, die ein übermäßiges Rotieren von Objekten während eines Fokuswechsels verhindern sollen.

    Theoretisch können mit dieser Art der Darstellung eine ganze Reihe zuvor besprochener Probleme in der Visualisierung umfangreicher Informationsmengen gelöst werden. Bezüglich der Probleme, die im Zusammenhang mit dem Design von Menüsystemen bekannt sind, löst der Hyperbolic-Tree-Browser das Problem einer möglichst breiten Menüstruktur durch die Verzerrung von Menüeinträgen an den Rändern. So werden immer alle "Menüeinträge" (bzw. Knoten) einer Ebene angezeigt - wenn sie im Focus sind auch lesbar, ansonsten gestaucht.

    Desweiteren stellt das Programm eine Synthese aus einem Direct-Manipulation-System und einem Menüsystem dar.

    In einer aktuellen Evaluationsstudie (Pirolli, Card & van der Wege, 2000), die den Einfluß der Navigationsbedingung (Hyperbolic-Tree vs. Microsoft-Dateimanager) bei verschiedenen Suchaufgaben untersuchte, kamen die Autoren zu dem Schluß, der Hyperbolic-Tree sei einem vergleichbaren Visualisierungswerkzeug ohne fisheye-Technik bei der Beantwortung von Retrieval-Fragen überlegen (in Bezug auf die Bearbeitungszeit). Nähere Diskussion dieser Ergebnisse im Zusammenhang mit der vorliegenden Untersuchung soll in 7. erfolgen.

     

    Fragedimensionen

    Um verschiedene Task-Bedingungen zu realisieren wurden zwei unterschiedliche Fragetypen eingesetzt: einfache Retrieval-Fragen und komplexere Strukturfragen. Im Falle der Strukturfragen waren zur Beantwortung neben Retrieval-Komponenten Vergleichprozesse unter Berücksichtigung von Strukturelementen der Site nötig, um die Fragen beantworten zu können. Unsere Vermutung diesbezüglich war, daß die Versuchspersonen bei der Beantwortung derartiger Fragen noch mehr von den Visualisierungstechniken profitieren würden, als bei den Retrieval-Tasks.

    Zu jeder Fragedimension wurden drei Fragen entwickelt und in abwechselnder Reihenfolge dargeboten.

    Ergebnisse

    Bearbeitungsgeschwindigkeit und Anzahl richtiger Lösungen

    Die Aufteilung der Suchfragen auf die beiden Dimensionen Retrieval vs. Struktur konnte mit konfirmatorischen Faktorenanalysen bestätigt werden. Wie aus Abb. 3 ersichtlich ist, sind die erwarteten Schwierigkeitsunterschiede für die beiden Fragetypen in allen drei Bedingungen konsistent aufgetreten.

    Bei den folgenden Analysen wurde für die Beantwortung der Suchaufgaben jeweils die Werte für spatial ability, Internet-Usage und thematisches Vorwissen als Kovariaten hinzugezogen. Da im nachgeschalteten Test für spatial ability einige Versuchspersonen abbrachen, reduziert sich die Anzahl der zu analysierenden Datensätze nochmals (genauere Angaben s.u.). Ergebnisse für die Kovariaten werden nur genannt, wenn sie signifikant sind.

    Die auffälligsten Effekte zeigen sich im Hinblick auf Anzahl richtiger Aufgaben für Retrieval-Fragen (MControl=2.50, SD=.64; MWT=2.79, SD=.41; MHT=2.15, SD=1.01) – hier scheiden die Nutzer des Hyperbolic Tree deutlich schlechter ab, F(2,146)=8.45; p<.01, h 2=.11. Post-Hoc-Vergleiche mit dem Bonferonni-Test zeigen einen signifikanten Unterschied zwischen WebToc und Hyperbolic Tree, nicht jedoch zwischen der Control-Bedingung und den Treatment-Bedingungen. Die Kovariate "spatial ability" hat ebenfalls einen signifikanten Einfluß, F(1,146)=5.19; p<.03,. h 2=.04.

    Anders verhält es sich für Struktur-Fragen, wenngleich deskriptiv ein ähnlicher Effekt zu beobachten ist (MControl=1.88, SD=1.13; MWT=1.96, SD=.89; MHT=1.85, SD=1.21), denn der Mittelwertsunterschied ist nicht signifikant. Allerdings zeigt hier die Kovariate "spatial ability" einen signifikanten Einfluß, F(1,152)=14.43, p<.01, h 2=.09.

    Abb. 3: Anzahl richtiger Aufgaben

    Betrachtet man die Ergebnisse für Bearbeitungsgeschwindigkeit, so ergibt sich ein ähnliches Bild. Auch hier kann ein signifikanter Mittelwertsunterschied für Retrieval-Fragen festgestellt werden (MControl=230sec., SD=125; MWT=205sec., SD=87; MHT=402sec., SD=147), F(2,147)=20.83; p<.01, h 2=.23. Im Post-Hoc Bonferonni-Test zeigt sich zudem, daß dieser Unterschied sowohl für den Vergleich von Hyperbolic Tree und WebToc, aber auch für das Verhältnis von Hyperbolic-Tree zur Control-Bedingung signifikant ist. Bringt man dieses Ergebnis mit dem vorab zitierten zusammen (vgl. Abb. 2), wird auch deutlich, daß kein speed-correctness-tradeoff zu beobachten ist.

    Die Mittelwerte der Bearbeitungsgeschwindigkeit für Struktur-Fragen (MControl=335sec., SD=195; MWT=328sec., SD=149; MHT=373sec., SD=163) unterscheiden sich nicht signifikant.

    Abb. 4: Bearbeitungsgeschwindigkeit

    Usability-Ratings

    Die von Lewis (1995) berichtete dreifaktorielle Struktur des Usability-Fragebogens konnte mit einer konfirmatorischen Faktorenanalyse gesichert werden (c 2(40, 177)=144.73; p<.01; sRMR=.048; GFI .86; NFI .91), obwohl von den ursprünglichen 19 Items nur 11 verwendet in einer deutschen Übersetzung verwendet wurden.

    Die Navigationsbedingungen wurden wie folgt bewertet: Hyperbolic Tree erhielt für alle drei Dimensionen die niedrigsten Werte, die Mittelwertsunterschiede für System-Usability (MControl=3.46, SD=1.53; MWT=3,25, SD=1,49; MHT=2,46, SD=1,68) und Information-Quality (MControl=3.47, SD=1.51; MWT=3,21, SD=1,48; MHT=2,48, SD=1,88) unterscheiden sich signifikant, FSysuse(2,155)=4.53; p<.02, FInfoqual(2,155)=4.22; p<.02. Der Faktor Interface-Quality zeigt deskriptiv etwas schwächer den gleichen Trend, der Unterschied ist in diesem Fall allerdings nicht signifikant.

    Abb. 5: Usability

    Zusätzlich zu den Items des Lewis-Instruments wurde mit einer weiteren Frage die Einschätzung des subjektiv empfundenen Schwierigkeitsgrades erhoben. Auch für dieses Item ergab sich ein signifikanter Mittelwertsunterschied zuungunsten des Hyperbolic Tree, F(2, 176)=3.93; p<.03.

    Dropout-Analyse

    Der hohe Dropout in dieser Untersuchung (55,3%) weist auf das generelle Problem selbstselegierender Stichproben in Online-Untersuchung hin, insbesondere auch deshalb, da eine genauere Analyse der Dropout-Fälle einen deutlichen Bias zuungunsten des Hyperbolic-Tree in diesen Fällen zeigt. Zwar konnte die Homogenität der verbleibenden asymmetrischen Stichproben hinsichtlich der erfassten Kennwerte gesichert werden, aber das Phänomen an sich sollte deshalb nicht unberücksichtigt bleiben, zumal für die Dropout-Fälle eine Reihe von interessanten Variablen gesichert werden konnten.

    Die meisten Dropout-Fälle wurden zum ersten Meßzeitpunkt festgestellt (78% des Gesamtdropouts). Als mögliche Einflußgrößen wurden die zugewiesenen Navigationsbedingung, das Betriebssystem und die Bildschirmauflösung erfasst.

    Die Analysen des Einflusses der genannten Faktoren (with adjusted alpha) auf die Dropout-Werte zeigt folgendes Bild: Wie aus Abb. 7 deutlich wird, hat die Tool-Bedingung einen erheblichen Einfluß auf den Dropout zum Zeitpunkt T1, c 2(2, 413)=27.55; p<.01.

    Abb. 6: Dropout und Untersuchungsbedingung

    Auch der Einfluß des Betriebssystems erweist sich als signifikant, c 2(4, 413)=19.20; p<.01. Wie aus Abb. 8 ersichtlich wird, zeigen die nicht-Microsoft-Betriebssysteme, MacOS, Linux und andere eine zu der großen Gruppe der Microsoft-Windows-Systeme gegenläufig Tendenz und verursachen mehr Abbrüche als im Falle keines Einflusses statistisch zu erwarten wäre. Komplementär dazu zeigt sich für die Gruppe der Microsoft-Systeme geringere Abbruchquoten als erwartet.

    Abb. 7: Dropout und Betriebssystem

    Einen sehr erstaunlichen Befund liefert die Analyse des Faktors screen resolution. Da im Experiment die Visualisierung komplexer Informationslandschaften thematisch war, wäre zu erwarten gewesen, daß geringe Bildschirmauflösungen zu höheren Abbruchquoten führen würden. Tatsächlich ist der umgekehrte Effekt festzustellen – User mit höherer Auflösung verlassen das Experiment eher frühzeitig als solche mit geringer Auflösung. Der Unterschied ist signifikant, c 2(1, 413)=6.70; p<.02.

    Abb. 8: Dropout und Bildschirmauflösung

    Die Variable "Browser" verursachte keinen signifikanten Einfluß auf das Abbruchverhalten.

    Lost in Hyperspace?

    Mit der Frage "Ich hatte manchmal das Gefühl nicht mehr zu wissen, wo ich bin" sollte das Ausmaß des subjektiv empfundenen Orientierungsverlusts während der Bearbeitung der Suchfragen erhoben werden. Wenngleich die Mittelwertsunterschiede für diese Frage nicht signifikant wurden, zeigt sich deskriptiv ein erstaunlicher Effekt, denn die höchsten (=Zustimmung) Werte für diese Frage gaben wiederum die User des Hyperbolic Tree.

    Für das Konzept des "lost in hyperspace" ist zudem auffallend, daß keine Korrelation zwischen den Werten für "spatial ability" und diese subjektiven Angaben zum Orientierungsverlust festgestellt werden konnten.

     

    Diskussion

    Die Ergebnisse zeigen deutlich, daß Hyperbolic Tree in keiner Bedingung in der Lage ist, das Bearbeiten von Suchaufgaben in einem komplexen Hypertext zu unterstützen. Im Gegenteil scheint das Programm bei der Bearbeitung solcher Aufgaben sogar eher hinderlich zu sein und für noch mehr Disorientation zu sorgen. Es gibt allerdings mindestens zwei Hinweise, daß es sehr wohl möglich ist bzw. wäre, eine derartige Unterstützung zu leisten. Zum einen überzeugen die guten Ergebnisse der User von WebToc bei Retrieval-Fragen, zum anderen gibt die Wirkung des Faktors spatial ability bei Strukturfragen Hinweise darauf, daß räumliche Kognitionen durchaus einen wichtigen Anteil bei der Lösung solcher Aufgaben beitragen. Leider scheint es aber in keiner der getesteten Bedingungen zu einer spürbaren Unterstützung derartiger Prozesse gekommen zu sein.

    Die Ergebnisse werden weiter unterstützt von den Usability-Ratings der Versuchspersonen. Auch hier schneidet der Hyperbolic-Tree sehr schlecht ab. Ein ähnliches Bild zeigt sich für die learning-curve und die starken Dropout-Effekte (die zusätzlich zu einem konservativen Effekt zugunsten des Hyperbolic-Tree geführt haben dürften).

    Einwände gegen die mangelnde Kontrolle infolge des Web-Experiments konnten durch die Einbeziehung möglicher Störvariablen als Kovariaten und konservative statistische Berechnungen ausgeräumt werden. Die festgestellten Effekte erweisen sich demnach als sehr stabil. Zudem konnten vielfältige Hinweise für die Validität der Untersuchung zusammengetragen werden.

     

    Literatur

    1. Chen, C. & Czerwinski, M. (1997). Spatial ability and visual navigation: an empirical study. New Review of Hypermedia and Multimedia, 3, 67-90.
    2. Dillon, A. & Vaughan, M. (1997). "It's the journey and the destination": Shape and the emergent property of genre in evaluating digital documents. New Review of Multimedia and Hypermedia, 3, 91-106.
    3. Furnas, G. W. (1986). Generalized fisheye views. Proceedings of ACM CHI 86 Conference on Human Factors in Computing Systems.
    4. Krantz, J. H. & Dalal, R. (2000). Validity of Web-Based Psychological Research. In M. H. Birnbaum (Hrsg.), Psychological Experiments on the Internet. San Diego: Academic Press.
    5. Lamping, J., Rao, R., & Pirolli, P. (1995). A focus+context technique based on hyperbolic geometry for visualizing large hierarchies. Conference proceedings on Human factors in computing systems, 401-408
    6. Lewis, R. J. (1995). IBM Computer Usability Satisfaction Questionnaires: Psychometric Evaluation and Instructions for Use. International Journal of Human-Computer Interaction, 7(1), 57-78.
    7. McDonald, S., & Stevenson, R. J. (1998). Navigation in hyperspace: An evaluation of the effects of navigational tools and subject matter expertise on browsing and information retrieval in hypertext. Interacting with Computers, 10(2) 129-142.
    8. Nation, D. (1998). WebTOC: A Tool to Visualize and Quantify Web Sites using a Hierarchical Table of Contents Browser. Proceedings of the 1998 ACM CHI-Conference on Human Computer Interaction, 185-186
    9. Pirolli, P., Card, S. K. & van der Wege, M. M. (2000 (in press)). The Effect of Information Scent on Searching Information Visualizations of Large Tree Structures. Conference Proceedings of the 5th Working Conference on Advanced Visual Interfaces
    10. Shneiderman, B. (1998). Designing the User Interface. Reading: Addison-Wesley.
    11. Shneiderman, B. (2000). Universal Usability. Communications of the ACM, 43(5), 84-92
    12. Verjeij, J., Stoutjesdijk, E. & Beishuizen, J. (1996). Search and Study Strategies in Hypertext. Computers in Human Behaviour, 12(1), 1-15


    Nückles, Matthias ; Bromme, Rainer Institution: Abteilung Pädagogische Psychologie, Albert-Ludwigs-Universität Freiburg
    Article (version: 25/06/2002 - 07:47, size: 17199)
    "Das Internet als Gegenstand der Kommunikation zwischen Experten und Laien. Eine Experimentalreihe im Internet."
    German:

    Das Internet als Gegenstand der Kommunikation zwischen Experten und Laien. Eine Experimentalreihe im Internet

    Matthias Nückles (Universität Freiburg)
    Rainer Bromme (Universität Münster)

    Einführung

    In der sogenannten Wissensgesellschaft wird in vielen Berufen von Fachleuten gefordert, dass sie nicht nur die Probleme lösen, für die sie spezialisiert sind, sondern auch, dass sie als Experten Fachwissen erklärend und beratend an Laien vermitteln können. Experten sollten daher in der Lage sein, flexibel auf die Kommunikationsbedürfnisse von Laien einzugehen (Bromme, Nückles & Rambow, 1999). Diese Fähigkeit zur Perspektivenübernahme ist besonders wichtig in einer Domäne wie dem Internet, da es sich hierbei um eine komplexe Informationstechnologie handelt, die in zunehmenden Maße beruflich und privat von Laien genutzt wird. Internet-Experten sind beispielsweise im Rahmen von Schulungen oder in der netzbasierten Hotline-Beratung gefordert, Laien internetspezifische Themen und Begriffe zu erläutern. Wie gut gelingt es diesen Experten, die Perspektive von Laien dabei zu berücksichtigen? Diese Frage stand im Mittelpunkt einer Reihe von Web-Experimenten (Nückles, im Druck; Nückles & Bromme, 2001). In diesem Beitrag wird zunächst ein Überblick über die zentralen Ergebnisse der Untersuchungsreihe gegeben. Darauf aufbauend werden in einem weiteren Schritt konkrete Maßnahmen skizziert, die dazu beitragen können, die Perspektivenübernahme von Internet-Experten in der Kommunikation mit Laien zu optimieren.

    In der sprach- und sozialpsychologischen Literatur finden sich viele empirische Belege dafür, dass Menschen ihre Kommunikationsbeiträge mehr oder weniger gut auf den Rezipienten abstimmen. Dieses Prinzip des sogenannten Recipient Design (Clark, 1996) wird als grundlegend für erfolgreiche Kommunikation erachtet. Experten scheint jedoch eine solche Rezipientenanpassung oftmals schwerzufallen. Es ist anzunehmen, dass auf Grund der hohen Verfügbarkeit und Reichhaltigkeit ihres Wissens die eigene fachliche Perspektive auf den Erklärgegenstand von den Experten als dominant erlebt wird und dadurch die Perspektive des Laien in den Hintergrund tritt. Wie gut gelingt es nun Internet-Experten, in der Kommunikation die Perspektive von Laien zu berücksichtigen? Diese Frage haben wir am Beispiel der Planung von fachlichen Erklärungen für Laien näher untersucht. Den Begriff der Planung verwenden wir hierbei in einem weiteren Sinne, als er normalerweise in der Psycholinguistik gebraucht wird. Gemeint ist nicht die Sprechplanungsphase im Rahmen der Äußerungsproduktion, sondern vielmehr die bewußte Vorbereitungsphase eines Vortrags oder beispielsweise die Antizipation eines Gesprächsverlaufs. Im Fokus der Analyse steht somit das Informal Reasoning (Galotti, 1989) der Internet-Experten, d.h. ihre Denk- und Entscheidungsprozesse, wenn sie Erklärungen internet-spezifischer Begriffe für Laien planen.

    Die zentrale Untersuchungsfrage lautete, ob und in welchem Maße es Internet-Experten bei der Planung solcher fachlichen Erklärungen gelingt, neben Informationen über die zu erklärende Sache auch Informationen über den Rezipienten zu berücksichtigen. In diesem Zusammenhang sind zwei konkurrierende Hypothesen relevant, die in der sprachpsychologischen Forschung diskutiert werden (Brown & Dell, 1987). Nach dem sogenannten Conceptual-Constraint-Account wird die Planung einer Äußerung, z.B. ob und wie ausführlich ein bestimmtes Wissenselement bei einer Erklärung erwähnt werden soll, weitgehend durch die konzeptuelle Repräsentation des Redegegenstands bestimmt. Nach dem Listener-Need-Account hingegen werden außerdem auch Annahmen über den Wissensstand des Gegenübers und dessen Informationsbedürfnis mitberücksichtigt.

    Methode

    Da Internet-Experten mit Laien oft via Internet kommunizieren (z.B. im Rahmen von Computer-Hotlines und Newsgroups), erschien es aus Gründen der ökologischen Validität naheliegend, die Untersuchungen als Web-Experimente zu realisieren. Die Experimente wurden als interaktive Hypertexte implementiert, die im Internet aufrufbar waren. Die Bearbeitungszeit betrug ca. 30 min. Die Experten-Probanden wurden über das Internet ausfindig gemacht und per E-Mail angesprochen. Die Stichproben der einzelnen Experimente setzten sich vorwiegend aus Mitarbeitern von Uni-Rechenzentren zusammen (z.B. Systemadministratoren und Webmaster). Zur Überprüfung ihres Expertenstatus füllten alle Probanden zunächst einen Eingangsfragebogen zu ihrer Person und ihren beruflichen Aufgaben aus, bevor sie am Experiment teilnehmen konnten. Die Notwendigkeit, vorab Informationen über sich preiszugeben, sollte dazu beitragen, die Compliance der Probanden zu erhöhen.

    Die eigentliche Experimentalsituation verlangte von den teilnehmenden Experten, sich eine fiktive Fortbildungssituation vorzustellen, in der sie Unterrichtsgespräche für zwei verschiedene Gesprächspartner vorbereiten. Die Aufgabe der Experten bestand darin, für eine Reihe von Internet-Themen zu planen, wie ausführlich sie bestimmte vorgegebene Fachbegriffe ihrem jeweiligen Gesprächspartner erklären würden. Die Experten planten z.B. für das Thema WORLD WIDE WEB, wie ausführlich sie die Begriffe BROWSER, HYPERLINK, URL, BOOKMARK, BROWSER-CACHE und CERN behandeln würden (vgl. Abbildung 1). Die Planung der Ausführlichkeit (6-stufige Ratingskala) bildete die abhängige Variable in den Experimenten. Eine unabhängige Variable war die sachliche Wichtigkeit der zu erläuternden Fachbegriffe (wichtige vs. weniger wichtige Begriffe). In Experiment 1 (N = 49) wurde als rezipientenbezogene Variable zusätzlich das computerbezogene Vorwissen der fiktiven Gesprächspartner systematisch variiert (Anfänger vs. Fortgeschrittener). Die Experten planten also sowohl für einen Anfänger als auch für einen fortgeschrittenen Computeranwender, wie ausführlich sie diesen jeweils die themenbezogen dargebotenen Fachbegriffe erläutern würden. In Experiment 2 (N = 48) wurde neben dem Vorwissen die Intention der Rezipienten als eine weitere unabhängige Variable eingeführt (theoretische vs. pragmatische Intention in Bezug auf den Erwerb von Wissen über das Internet).

    In Experiment 3 (N = 49) wurde schließlich untersucht, inwiefern das Ausmaß der Anpassung an das Vorwissen des Adressaten durch eine Interventionsmaßnahme erhöht werden kann. Die Intervention war der Bearbeitung der Planungsaufgabe vorgeschaltet. Sie unterstützte die Probanden darin, sich die Wissensunterschiede, die typischerweise zwischen einem Computeranfänger und einem Fortgeschrittenen bestehen, bewusst zu machen. Die Probanden erhielten dazu einige Begriffe aus dem allgemeinen Computerwissen vorgelegt (z.B. ZWISCHENABLAGE), die das Verständnis der Internetbegriffe erleichtern können (z.B. BROWSER-CACHE). Die Aufgabe der Probanden bestand nun darin, für jeden der Vorwissensbegriffe einzuschätzen, wie groß die Wahrscheinlichkeit ist, dass ein Anfänger bzw. ein Fortgeschrittener diesen Begriff bereits kennt.

    Ergebnisse und Diskussion

    In allen Experimenten hatte die sachliche Wichtigkeit der zu erläuternden Begriffe den stärksten Effekt auf die Ausführlichkeitsplanung (Ex. 1: F(1,48) = 173.6, p < .001; Ex. 2: F(1,46) = 276.89, p < .001; Ex. 3: F(1,48) = 255.4, p < .001) . Für Internet-Experten bilden offenbar sachstrukturelle Merkmale der Fachkonzepte den primären Bezugspunkt, wenn sie Erklärungen für Laien planen. In Widerspruch zum Conceptual-Constraint-Account belegen die Daten jedoch auch eine gewisse Anpassung an die Rezipienten. In Experiment 1 zeigte sich beispielsweise ein signifikanter Wechselwirkungseffekt zwischen Vorwissen und sachliche Wichtigkeit, F(1,48) = 8.35, p < .01 (vgl. Abbildung 2, linkes Diagramm), der darauf hinweist, dass die Experten versuchten, sachbezogene und rezipientenbezogene Informationen miteinander zu verknüpfen. Das Ergebnis ist somit als Beleg für den Listener-Need-Account zu werten. Der Effekt ist allerdings relativ klein. Den Experten bereitet es offenbar Schwierigkeiten, unterschiedliche Vorkenntnisse auf Seiten der Rezipienten zu berücksichtigen. Dies verdeutlicht insbesondere der Vergleich mit den Ergebnissen aus Experiment 2. Die Experten hatten offenbar keine Probleme, den Unterschied zwischen einer theoretischen und einer pragmatischen Intention zu berücksichtigen, F(1,46) = 97.19, p < .001 (vgl. Abbildung 2, rechtes Diagramm). Es ist denkbar, dass den Experten die Anpassung der Erläuterungsplanung an die Rezipienten-Intention besonders leicht fiel, weil sie je nach Thema und Problem eine der beiden hier vorgegebenen Intentionen von sich selbst kennen. Die Integration des Merkmals Vorwissen erfordert demgegenüber in stärkerem Maße die Einnahme der Perspektive des Gegenübers (welches Verständnis kann ich bei einem Fortgeschrittenen im Vergleich zu einem Anfänger wahrscheinlich voraussetzen?).

    Die Ergebnisse des Interventionsexperiments (Ex. 3) zeigen nun, dass es durchaus möglich ist, die Flexibilität der Experten, auf unterschiedliche Vorkenntnisse einzugehen, zu erhöhen. Die Vergegenwärtigung der potentiellen Vorwissensunterschiede zwischen Anfängern und Fortgeschrittenen führte zu einer signifikanten Zunahme des Wechselwirkungseffekts zwischen den Variablen Vorwissen und sachliche Wichtigkeit (Wechselwirkung zwischen Vorwissen & Wichtigkeit in Ex. 3: F(1,48) = 53.1, p < .001; Vergleich zwischen Ex.1 und Ex. 3: t(96) = -1.68, p < .05). Den Experten fiel es also auf Grund dieser Intervention deutlich leichter, die Informationen über das Rezipientenmerkmal Vorwissen in die Erläuterungsplanung einzubeziehen. Bemerkenswert ist hierbei, dass dieses Ergebnis bereits durch eine relativ minimalistische Interventionsmaßnahme erzielt werden konnte. Die Experten wurden lediglich gebeten, sich anhand einiger konkreter Begriffe Gedanken über die potentiellen Verständnisprobleme von Laien zu machen. Die Maßnahme hat den Experten offenbar ermöglicht, eigene Erfahrungen mit Anfängern und Fortgeschrittenen zu aktualisieren, wodurch es ihnen anschließend besser gelang, diese Unterschiede bei der Erläuterungsplanung zu berücksichtigen.

    Praktische Implikationen

    Der Erfolg der minimalistischen Intervention in Experiment 3 führt zu der Schlussfolgerung, dass es in der Praxis ggf. bereits mit relativ wenig Aufwand gelingen kann, die Perspektivenübernahme von Internet-Experten in der Kommunikation mit Laien effektiv zu unterstützen. Wie könnte solche eine Unterstützungsmaßnahme gestaltet sein? Aufgrund der genannten Ergebnisse ist es sinnvoll, ein Werkzeug zu entwickeln, das es Computer-Experten erleichtert, in Beratungssituationen die Vorkenntnisse von Ratsuchenden abzuschätzen und zu berücksichtigen. Ein solches Assessment Tool ist vor allem für die asynchrone netzbasierte Beratung geeignet, die eine wichtige Form der Kommunikation zwischen Internet-Experten und Laien darstellt (z.B. Hotlineberatung per E-Mail). Erstens stehen hier im Unterschied zur Face-to-Face-Kommunikation den Kommunikationspartnern weniger Kommunikationskanäle zur Verfügung (z.B. fehlende nonverbale Kommunikation). Zweitens sind die Möglichkeiten zu unmittelbarem Feedback durch den Partner eingeschränkt (Hesse et al., 1997). Diese Besonderheiten der E-Mail-Kommunikation erschweren es, den Wissenshintergrund des Kommunikationspartners zuverlässig abzuschätzen und so wechselseitiges Verstehen im Sinne eines Common Ground zu erzielen (Clark & Brennan, 1991).

    Wie könnte nun ein Assessment Tool (AT) zur Abschätzung des Vorwissens konkret aussehen? Denkbar ist, dass Ratsuchende, die eine Anfrage an die Computer-Hotline stellen, im Rahmen eines Internet-Formulars gebeten werden, dem Hotlineberater zusätzlich zu ihrer eigentlichen Frage bzw. ihrem Problem verschiedene Hintergrundinformationen zu geben. Ein solches AT würde somit aus einem kurzen Fragenkatalog bestehen (vergleichbar den Anamnesebögen, die in vielen Arztpraxen eingesetzt werden), der es einerseits dem Ratsuchenden gestattet, seine Anfrage präzise zu beschreiben und andererseits dem Hotlineberater hilft, den Wissenshintergrund sowie das konkrete Informationsbedürfnis des Anfragenden näher einzugrenzen. Dabei sollte das AT relativ wenige, zugleich jedoch möglichst diagnostische Fragekategorien umfassen, die es für einen routinemäßigen Einsatz in der Hotlineberatung praktikabel machen (vgl. Abbildung 4). Würden die Ratsuchenden mit zu vielen Fragen konfrontiert, würden sie sich gewiss weigern, diese zu beantworten. Zudem kann das AT vor allem dann für den Berater von Nutzen sein, wenn es ihm ermöglicht, aufgrund einer kleinen Anzahl hoch relevanter Informationen sich ein Bild über die Perspektive des Ratsuchenden zu machen.

    Betrachtet man die Interfaces bestehender Support-Dienste, wie sie beispielsweise von Universitätsrechenzentren und großen Softwareherstellern betrieben werden, stellt man fest, dass diese in der Regel dem Ratsuchenden lediglich Fragekategorien anbieten, die sich auf rein sachbezogene Aspekte des Problems beziehen. Es handelt hier also um einen rein sachzentrierten Ansatz, bei dem davon ausgegangen wird, dass der Ratssuchende schon recht klare Vorstellungen über sein Problem und dessen Zuordnung zu den Vorgaben des Support-Dienstes hat. Demgegenüber wird mit dem hier vorgestellten Assessment Tool (vgl. Abbildung 4) vielmehr ein nutzerzentrierter Ansatz verfolgt: Dem beratenden Experten werden neben Informationen über die sachliche Seite des Problems auch Informationen über den Wissenshintergrund des Ratsuchenden - im Sinne des Listener-Need-Accounts - zur Verfügung gestellt, die es dem Berater erleichtern, seine fachliche Erläuterungen auf das Informationsbedürfnis und die Vorkenntnisse des Ratsuchenden abzustimmen. Ein solches nutzerzentriertes Assessment Tool Interface wird gegenwärtig in einem Folgeprojekt unter Labor- und Feldbedingungen auf seine Wirksamkeit überprüft.

    Literatur

    Bromme, R., Nückles, M., & Rambow, R. (1999). Adaptivity and anticipation in expert-laypeople communication. In S. E. Brennan, A. Giboin, & D. Traum (Eds.), Psychological models of communication in collaborative systems. AAAI Fall Symposium Series (pp. 17-24). Menlo Park, CA: AAAI.

    Brown, P. M. & Dell, G. S. (1987). Adapting production to comprehension: The explicit mention of instruments. Cognitive Psychology, 19, 441-472.

    Clark, H. H. (1996). Using language. Cambridge: University Press.

    Clark, H. H., & Brennan, S. E. (1991). Grounding in communication. In L. B. Resnick, J. M. Levine, & S. D. Teasley (Eds.), Perspectives on socially shared cognition (pp. 127-149). Washington, DC: American Psychological Association.

    Galotti, K. M. (1989). Approaches to studying formal and everyday reasoning. Psychological Bulletin, 105, 331-351.

    Hesse, F. W., Garsoffky, B. & Hron, A. (1997). Interface-Design für computerunterstütztes kooperatives Lernen. In L. J. Issing & P. Klimsa (Hrsg.), Information und Lernen mit Multimedia (S. 253-267). Weinheim: Psychologie-Verlags-Union.

    Nückles, M. (im Druck). Perspektivenübernahme von Experten in der Kommunikation mit Laien. Eine Experimentalserie im Internet. Münster: Waxmann.

    Nückles, M. & Bromme, R. (2001). Planning explanations of specialist concepts: How good are internet-experts in taking the perspective of laypersons? Manuscript under review.


    Orthmann, Claudia ; Institution: Institut für Pädagogische Psychologie und Medienpsychologie, Freie Universität Berlin
    Article (version: 25/06/2002 - 07:47, size: 13020)
    "Methoden und Probleme der Datenerhebung in der qualitativen Chat-Forschung."
    German: Abstract
    Im Rahmen des von der Berlin-Forschung geförderten Projekts "Prozessanalyse der Kommunikation von Kindern und Jugendlichen im Internet" wird die Chat-Kommunikation von Berliner Kindern und Jugendlichen im Alter von 10-17 Jahren erforscht. Die Chat-Kommunikation wird hierbei anhand von Chat-Logfiles mit Hilfe der Konversationsanalyse hinsichtlich dem Kommunikationsprozess zugrundeliegender interaktiver Regeln und Strukturen untersucht.
    Zur Untersuchung der kommunikativen Vorgänge wurden während der Datenerhebung verschiedene Verfahren der Protokollierung von Chaträumen getestet und hinsichtlich ihrer Datenqualität bewertet. Im Zuge der Datenerhebung und der vielfältigen Probleme (z.B. bei der Protokollierung von Webchats) entstanden zwei Datensammlungen: Der größere Datenkorpus besteht aus Logfiles eines Berliner Kinder- und Jugendchats durch den Zugriff auf den Chatserver. Der zweite Datenkorpus besteht aus Screenshots von Webchats, die im Rahmen eines eher als experimentell zu bezeichnenden Setting entstanden. Neben der Chat-Kommunikation wurden in diesem Setting auch zusätzliche Daten zur Gesprächssituation erhoben, u.a. durch Interviews und das Filmen der Chatter während des Chat-Prozesses.
    Das Poster stellt anhand der Datensammlungen des Projektes Methoden und Probleme der Datenerhebung in der qualitativen Chat-Forschung dar. Aspekte wie die Anonymität der Chatter, die technischen Funktionsweisen der einzelnen Chatsysteme und ihre Protokollierbarkeit sowie Fragen zur Forschungsethik haben einen großen methodischen und methodologischen Einfluß auf die Datensammlung in der Chat-Forschung.

    Einleitung
    Die Datenerhebung in der qualitativen Chat-Forschung gestaltet sich in vielen Forschungsprojekten schwieriger als ursprünglich erwartet. Aufgrund der Digitalisierung wird weitläufig angenommen, dass die Forschung im Internet sich relativ einfach gestaltet, da ja die Daten in den Rechnern sowieso vorhanden sind (vgl. Jones 1999, Köhler 1999). Sicherlich bieten einige computergestützte Verfahren neue Möglichkeiten für die qualitative Sozialforschung, die meisten bislang eingesetzten Methoden der Online-Forschung sind jedoch der quantitativen Forschung zuzuordnen: z.B. Online-Fragebögen, statistische Server-Log-Analysen oder experimentelle Forschung zu wahrnehmungspsychologischen Aspekten. Der Zugang zu den Daten der Chat-Kommunikation ist nicht immer leicht. Einige Forscher sammeln solche Daten, in dem sie z.B. selbst Chats aufsuchen, an diesen teilnehmen oder lurken und loggen dabei die Gespräche mit (z.B. Danet 1998). Andere Forscher bedienen sich experimenteller Settings (s.a. Klemm & Graner 2000) oder eröffnen eigene Chats oder Chaträume/-kanäle. Diese Verfahren werden im Folgenden als "chat(-raum)-zentriert" bezeichnet, da der genutzte Chat während der Datenerhebung derselbe bleibt (s. Tab. 1).


    Der im Forschungsprojekt "Prozessanalyse der Kommunikation von Kindern und Jugendlichen im Internet" gesuchte Zugang zu den Daten gestaltete sich komplizierter, da das Alter der Chatter eine Rolle spielte. Deshalb wurden neben einem chatzentrierten Zugang (Datenkorpus EC) zusätzlich die Möglichkeiten der "chatterzentrierten" Datenerhebung getestet (Datenkorpus CMR). Die chatter-zentrierte Datenerhebung bringt allerdings vielfältige Probleme mit sich, die in Ausschnitten vorgestellt werden.

    Chat-zentrierte Datenerhebung
    Im vorgestellten Forschungsprojekt wird die Chat-Kommunikation von Kindern und Jugendlichen im Alter von 10-17 Jahren untersucht. Aufgrund der normalerweise bestehenden Anonymität von Chattern, die zuverlässige Aussagen über das Alter der Chatter nicht erlaubt, wurde die Kooperation mit einem von Berliner Einrichtungen unterstützten Kinder- und Jugendchat gesucht. Dieser Chat wird seit einem Jahr donnerstags von 16-18 Uhr von den lokalen Einrichtungen als virtueller Treffpunkt von Kindern und Jugendlichen genutzt. Mittels einer kleinen Umfrage wurde die Beobachtung validiert, dass in diesem Zeitraum außer dem Moderator ausschließlich Kinder und Jugendliche dort chatten. Der Forscherin wurde freundlicher Weise mithilfe des Passworts Zugang zum Chat-Server und damit den Logfiles der Chaträume gewährt, so dass von Juli bis Dezember 2000 die Logfiles gespeichert werden konnten (vgl. Abb. 1).


    Aus forschungsethischer Sicht ist es wichtig zu betonen, dass nur die "öffentliche" und keine "private" Kommunikation ("Flüstern", chatten in "Separees" etc.) protokolliert wird. Den Chattern ist theoretisch durch die lokalen Praxen und Bedingungen der Internetnutzung bekannt, dass ihre Nutzung überwacht und gespeichert wird.
    Relevant für eine detaillierte Auswertung (z.B. mit Hilfe der Konversationsanalyse) der Chat-Kommunikation sind die Bestandteile eines Logfiles: Systemmeldungen (wie das Betreten oder Verlassen des Chats durch einen Chatter) sind neben der Zeitangabe von Aktionen und Handlungen wesentliche Informationen für die qualitative Analyse eines Chat-Logfiles. Mit ihrer Hilfe entsteht im Logfile eine annähernd identische Speicherung der Gesprächssituation, die um einiges detailgetreuer ist als beispielsweise die Transkription von Telefongesprächen, obgleich zeitliche Aspekte wie das "Hängen" eines Chats oder die Zeitverzögerung zwischen dem Abschicken einer Aktion und dem Erscheinen auf den eigenen bzw. fremden Monitoren zwangsläufig fehlen.

    Für das vorgestellte Forschungsprojekt sollten jedoch über Aussagen zu Strukturen der Chat-Kommunikation hinaus u.a. Aussagen zum Verhältnis zwischen der Interaktion von (mehreren) Nutzern vor dem Bildschirm und ihrer Chat-Kommunikation gemacht werden. Für die Untersuchung dieser Fragen waren die Daten der chat-zentrierten Erhebung (Logfiles) nicht geeignet, so dass parallel ein zweiter Datenkorpus erhoben wurde. Bei diesem wurden verschiedene Methoden trianguliert. Massive technische Probleme entstanden bei den begleitenden Versuchen, weitestgehend nicht-reaktiv, d.h. ohne durch die Forschung die Situation zu beeinflussen, die Chat-Kommunikation in Webchats zu erheben.

    Chatter-zentrierte Datenerhebung: Probleme der Logfile-Generierung
    Die jugendlichen Teilnehmer des Forschungsprojektes wurden in die Uni eingeladen, um einen dort zur Verfügung gestellten Computer mit Internetzugang zum Surfen, Chatten, etc. zu nutzen. Vor der ersten Internetsitzung mussten sie eine Einverständniserklärung der Eltern vorweisen, einen Fragebogen ausfüllen und ein kurzes Interview zu ihrer Interneterfahrung geben. Die Datenerhebung zeigte, dass mit einer Ausnahme alle Teilnehmer diverse Webchats bevorzugten, welche jedoch grösstenteils keine Möglichkeit zur Logfile-Generierung bieten. Die Chatkanäle des IRC, welche sich im Vergleich zu Webchats problemlos hätten mitloggen lassen, waren den Jugendlichen selten bekannt. Ein Teilprojekt zum Chatten im IRC, wurde wegen der Schwierigkeiten, jugendliche IRCer in Berlin zu finden und zur Teilnahme zu bewegen, eingestellt. Da die Videoaufnahmen von den Teilnehmern in Zusammenhang mit ihrer Chat-Logfiles gestellt werden sollten (s. Datenresultat in Abb. 2), wurde auf verschiedenen technischen Wegen nach Lösungen zur Erhebung bzw. Generierung der Logfiles gesucht. Die Teilnehmer sollten in ihren gewohnten Chats kommunizieren können, so dass kein experimentelles Setting mit einem speziellen Chat vorgegeben werden konnte. Es wurde festgestellt, dass die Chatter in einer Sitzung häufig von einer URL bzw. einem Webchat zum nächsten "sprangen", weshalb eine Kooperation mit den entsprechenden Chat-Anbietern z.B. von "www.rtl.de" keine Alternative darstellte. Das während der Sitzungen auf Video aufgenommene Monitorgeschehen hatte bei analoger Aufnahme eine für eine Transkription zu schlechte Auflösung und ohne eine teure technische Rechnerausstattung ließ sich das Monitorgeschehen ebensowenig zufriedenstellend als digitales Video speichern und nachbereiten.


    Nach diversen Tests stellte sich folgende Prozedur als in unserem Rahmen einzig realisierbare heraus:
    Die Datengrundlagen für die Logfiles wurden erhoben, indem über eine Netzwerksoftware ("Timbuktu Pro") die Bildschirmansicht der Teilnehmer auf einen entfernten Rechner gespiegelt wurde und auf diesem Rechner automatisch alle 12 Sekunden Screenshots der Ansicht gemacht wurden (s. Abb. 3).


    Der Vorteil bei dieser Methode war, dass die Teilnehmer nicht durch die Erstellung der Bildschirmfotos in ihrer Internetnutzung gestört wurden, was bei der Speicherung auf demselben Rechner der Fall war. Allerdings birgt diese Erhebungsmethode einen massiven, zeitlichen Nachbereitungsaufwand in sich, da jedes Bildschirmfoto in mehreren Schritten in einem Grafikprogramm freigestellt und anschließend in einem Textverarbeitungsprogramm zu einem zusammenhängenden Logfile zusammengesetzt werden muss. Pro Sitzung entstanden rund 450 Bildschirmfotos. Somit handelt es sich leider um eine wenig effiziente Methode, die im Hinblick auf die Erhebung von Chat-Logfiles nur bedingt empfohlen werden kann.

    Zusammenfassung
    Die beschriebenen Probleme der Datenerhebung entstanden meist durch die technischen Grenzen bei der Realisierung. Das Vorhaben,ein weitestgehend nicht-reaktives, chatter-zentriertes Setting zu schaffen, wurde nur in Ansätzen realisiert. Die während der Testerhebungen gesammelten Erfahrungen zeigen, dass jede Veränderung des Untersuchungsdesigns starke Auswirkungen auf die methodischen Grundvoraussetzungen einer Studie hat. Während uns diese Erfahrung einerseits half, eigene Vorannahmen über die Chat-Kommunikation zu explizieren, machte sie es andererseits unmöglich, das angestrebte methodische Design beizubehalten. Aufgrund des Ziels, die alltägliche Chat-Kommunikation von Kindern und Jugendlichen in ihrer gewohnten Kommunikationskultur zu erheben, wurde das Untersuchungsdesign im Laufe der Studie mehrmals den Erhebungsbedingungen angepasst. Dabei wurden experimentelle Elemente wie Videoaufnahmen der Sitzungen und die Durchführung der Erhebung an Uni-Rechnern in Kauf genommen.
    Der Umgang mit forschungsethischen Problemen in Online-Umgebungen (z.B. in Bezug auf die Zustimmung aller Chatter in einem Chat zur Verwendung des Materials) oder allgemeinen Problemen (wie dem Umgang mit dem Verhältnis der Anonymität von Internetnutzern und der demographischen Informationen über diese) sind ebenfalls wichtige Aspekte für die Forschungsplanung, Lösungen oder Kompromisse in diesen Bereichen lassen sich allerdings im allgemeinen leichter finden als Lösungen bezüglich der technischen Probleme des Forschungsalltags.
    Es lässt sich zusammenfassen, dass bislang keine geeignete nicht-reaktive Methode zur chatter-zentrierten Datenerhebung in Webchats existiert. Es bleibt zu hoffen, dass mit fortschreitender technischer Entwicklung im Bereich der Online-Forschung dieser Mangel behoben wird, und eine entsprechende Software entwickelt werden wird.

    Ausblick
    Derzeit wird die Auswertung des "Datenkorpus CMR" vorgenommen. Der analytische Schwerpunkt liegt dabei auf der interaktiven Aushandlung der Gesprächspartner untereinander und die Beziehung zwischen der allgemeinen Plauderei und der sich teilweise anschließenden Zweierkommunikation. Von den Jugendlichen, die zur Internetnutzung ins CMR kamen, werden anhand des Materials Falldarstellungen erarbeitet, welche einen Einblick in die verschiedenen Vorgehensweisen erlmöglichen. Erste Ergebnisse werden im Dezember 2001 veröffentlicht.

    Literatur
    Danet, Brenda; Ruedenberg, Lucia; Gurion, Ben & Rosenbaum-Tamari, Yehudit (1998). "Hmmm ... Where's that Smoke coming from?" Writing, Play and Performance on Internet Relay Chat In: Sudweeks, F,; McLaughlin, M. L. & Sheizaf, R. (Hrsg.): Network and Netplay: virtual groups on the Internet. Cambridge, M.A: MIT Press. S. 41-76.
    Jones, Steve (Hrsg.). Doing Internet Research. Critical Issues and Methods for Examining the Net. Thousand Oaks: Sage Publications, 1999.
    Klemm, Michael & Graner, Lutz: Chatten vor dem Bildschirm: Nutzerkommunikation als Fenster zur alltäglichen Kommunikationskultur. In: Thimm, C. (Hrsg.) Soziales im Netz. Sprache, Beziehungen und Kommunikationskulturen im Internet. Opladen: Westdeutscher Verlag 2000, S. 156-179.
    Köhler, Thomas (1999). Methodik und Methodologie der Forschung zur Internet-Kommunikation. In: Frindte, W. & Köhler, T.: Kommunikation im Internet. Frankfurt a. Main: Peter Lang Verlag, S. 183-195.

    Kontakt
    Freie Universität Berlin,
    FB Erziehungswissenschaft & Psychologie,
    Institut für Pädagogische Psychologie und Medienpsychologie,
    Center for Media Research (CMR),
    Dipl.-Psych. Claudia Orthmann
    Malteser Str. 74-100, 12249 Berlin
    Email: orthmann@cmr.fu-berlin.de,
    Projekt-Homepage


    Osipova, Elena M. ; Institution: Interdisciplinary Center for Advanced Professional Education, Saint-Petersburg State University
    Article (version: 25/06/2002 - 07:47, size: 14464)
    "Individualization of distance education through adaption. Adaptive assessment"
    German:

    Individualization of distance education through adaption. Adaptive assessment.


    Development of distance education systems (DES) requires thorough analysis, design and maintenance, as development of any information system does. When developing DES, it should be taken into account that DES has typical for information systems features, as well as it's peculiar characteristics, and has higher level of organization than an "ordinary" DE course or program. Most of DES peculiarities are connected with significant influence of human components on DE system.

    DES specific functions include, among others, comprehensive and consequent support of educational process and support of DES component's compatibility (software, logical, etc.). It is important to mention that development of adaptive systems and integration of national DE systems within international ones are possible only when applying system's approach to development of distance education systems.

    A short overview of the above mentioned aspects of DES development is given below.

    Comprehensive and consequent support of educational process. Distance education system is to be built on the basis of some educational structure - chair, faculty, university, consortium, etc. - to provide consistency on organizational, administrative, educational, technical and information levels. All educational functions within a structure should be supported. In such a system three main subsystems are usually identified. They are learner-oriented, instructor-oriented and administrator-oriented DES subsystems. These subsystems interchange with information on educational process and add information to learner records (ideally, learner records should be life-long and transferred between educational institutions, which learner attend during his/her life).

    Compatibility of distance education system components. Compatibility is used mainly in the sense of a software term here, as distance education systems undoubtedly should be based on information technologies and Internet. Although, when designing a system, we should consider also compatibility of educational content in the context of national educational standards (not technological) and educational policy of organization. The following compatibility tasks could be mentioned:

    • In order to provide a basis for cooperative use of educational curricula, courses, etc., the agreements concerning interface components and structure of content modules should be specified.
    • In order to ease exchange with educational information, acceptable data formats should be defined.
    • In order to provide retrieval of educational information on Internet, metadata structure and format should be supplied (according international standards preferably).

    International learning technology standards. There exists a number of international projects on development of standards for educational information systems, the most advanced are the following:

    • ARIADNE (European Union) http://ariadne.unil.ch/
    • IMS (USA) http://www.imsproject.org/
    • ADL (US department of Defense) http://www.adlnet.org/
    • AICC (US Aviation Industry CBT) http://www.aicc.org/

    These organizations are the most active participants in the development of international learning technology standards within IEEE Learning Technology Standards Committee (http://grouper.ieee.org/p1484/). Within this committee the following main directions for standardization exist:

    • Architecture and general system requirements
    • Learner model, instructor model and their interaction models
    • Course development (educational content)
    • Data and metadata
    • Educational management systems

    Architecture serves the technological skeleton for building distance education system. Thus, the design tasks for DES architecture development determine the features, which the resulting DE system will have. Let us cite the architecture standard (which is not yet finalized), developed by IEEE LTSC:

    "In general, the purpose of developing systems architectures is to discover high-level frameworks for understanding certain kinds of systems, their subsystems, and their interactions with related systems. An architecture … is a framework for designing a range of systems over time, and for the analysis and comparison of these systems. … An architecture promotes the design and implementation of components and subsystems that are reusable, cost-effective and adaptable."

    As you see, adaptivity is included in the main characteristics of learning technology systems. Here it has the meaning of "adaptation to technology changes because the adaptation is only incremental change when viewed at the right of level of abstraction, i.e., helps manage change and reduce technical risk". Later in this paper we will consider other aspects of adaptivity, applied to distance education systems.

    Another confirmation of importance of this feature can be found in ADL requirements, formulated for educational software. There are six requirements, that are considered to be of vital importance when developing educational information systems. Educational information systems and their components should be:

    • interoperable
    • reusable
    • adaptable
    • durable
    • accessible
    • affordable.

    Now we come to the fourth aspect of DE system's development: development of adaptive systems. The main advantage of distance education is the possibility to provide individual approach to learners. Individualization is considered to be an advantage in most educational cases, but in distance learning it is the only way to compensate the lack of personal communication, emotional contact and feedback from instructor. Individualization may be realized through individual work with instructor or through adaptation of educational materials, computer programs and learning technology systems in general.

    Individualization can be realized through adaptation of educational materials, computer programs, and learning technology systems in general. The key tasks in providing individualization of distance education are the ones of development of adaptive technologies and dynamic modular courseware building.

    The term "adaptivity" of learning technology systems is being used in at least five meanings:

    • adaptivity in time (to development of new hard- and software)
    • interface adaptivity
    • adaptivity of structure and content of DL course
    • learning style adaptivity
    • adaptivity of educational process management.

    It is possible to adapt various educational components to individual psychological, physiological and physical characteristics of learners, as well as to individual needs of learners, appearance of new knowledge and information, etc. All of the distance education system components are interconnected and most of them may be adapted: curriculum, course schedule, learning modules/units, tests, examples, etc.

    In distance learning environment various components could possess adaptive quality, e.g. learning schedule, course plan, learning modules (volume of new information per module), tests (complexity level), examples. All adaptive components are interconnected and influence each other. For example, adaptive tests can change learning schedule, thus spreading the adaptive quality on this learning environment component.


    Adaptive assessment.

    Adaptive tests are used for the following purposes: for distance learners to provide self-control, for educators to assess distantly the knowledge acquired by learners, and also for management of educational process. To manage educational process means here 1) to determine the basic level of learner's knowledge and assist in composing of individual course schedule; 2) to determine the degree of knowledge perception and work out recommendations on repeating some materials if necessary.

    The simple example of adaptation - adaptive assessment - is demonstrated below.


    The mechanism of adaptive testing has advantages especially in the case of continuous learning when we face the problems of difference in levels of basic knowledge of learners, lack of time to study the whole course, etc. In this case, the possibility to generate an individual plan of studies can save learner's time and efforts. As it is hardly possible for a learner to objectively self-evaluate his/her level of knowledge and competence on the subject, the technology of support of individual plan generation plays an important role in increasing effectiveness of education, both in terms of knowledge acquired and time saved.

    Procedure of adaptive testing performs the following tasks:

    • determines the basic level of learner's knowledge before studies and generates individual recommendations on studying the course;
    • controls knowledge, acquired during the studies; indicates "problem units" in the course and proposes individual plan for repeating the course units that were not correctly understood and remembered, providing thus the necessary feedback.

    This type of testing partially automate the work of instructor, preserving individual approach to learners.

    In adaptive test learner may perform one of the two actions:

    • Pass the test: learner receives a questionnaire, which is newly generated every time, the order and composition of questions don't repeat. He/she completes the test and sends the results back to the server. As a feedback, he/she receives HTML-page with evaluation of test results and recommendations on further way of studies.
    • View recommendations, worked out on the basis of previous results of test passing.

    Instructor (test developer) may determine the feedback interface and type of recommendations, generated by the program. The procedure of adaptive testing has a special algorithm of test development, including

    • Dividing material into groups.
    • Assigning parameter's values for questions of the group (scores for right and wrong answers). The group has one more parameter – number of questions from the group that will be included in the test.
    • Groups are united in metagroups, each metagroup corresponds to a relatively independent part of educational materials. Each metagroup has it's own parameters: 1) threshold (a number; if the sum of the answers' weights is more than a threshold, this metagroup is excluded from further tests for the learner – he/she knows this unit of educational materials), 2) messages for passing and non-passing the metagroup.

    An answer's protocol is generated and stored for each student. An instructor may analyze it, receiving the information on "problem units" and on the changes, necessary to made for the course.

    The past experience of our department in development and implementation of adaptive tests in the courses on high-performance computing for supercomputer center, proves the effectiveness of application of adaptive technologies in distance learning.

    Research project "Psychosocial aspects of application of modern information technologies in higher education".

    Individualization is based on adaptive technologies, the type of technologies that adapt a predefined set of educational materials to individual abilities and demands of learners. If to speak about Internet-based distance learning (or, generally, about computer-based distance learning), in order to provide individualization, we should consider three main fields of studies:

    1. psychosocial characteristics of learners
    2. learner's attitude towards computers
    3. particular learning styles

    We have studied the literature and Internet resources, available on the subject, and have defined three main types of questionnaires to use in the research according to the three fields, described above. These are:

    • psychological tests (evaluation of cognitive functions, studies of personality traits, interpersonal communication, studies of psychic state, studies in social-psychological sphere)
    • computer-attitude questionnaires
    • learning styles questionnaires

    What criteria (most evident) for building of adaptive systems are expected to be developed among others on the basis of the research conducted:

    • verbal/visual/other learning style - to use for accenting DL course materials on a particular type of media
    • group-based or individual learning - to be used for choosing the communication technology and type of remote studies
    • recommended duration of learning module, quantity of new information, etc.

    The research conducted will also help to determine the degree of influence of new information technologies on psychosocial characteristics of various types of learners and work out recommendations on the effective use of information technologies in educational process.

    Acknowledgements:

    The research on psychosocial aspects of application of new information technologies in higher education is supported by the "Research Support Scheme" of the Open Society Support Foundation, RSS/OSSF № 1488/2000.

    References:

    1. Osipova E. (2000) Application of adaptive assessment technologies for individualisation of distance learning, Materials of International seminar "Open distance education", 30-31 October, Saint-Petersburg, pps 32-34


    Papakyriazis, Natalia V. ; Boudourides, Moses A. Institution: Computer Technology Institute, Patras
    Article (version: 25/06/2002 - 07:47, size: 28226)
    "Electronic Weak Ties in Network Organizations."
    German:

    1. INTRODUCTION

    Networks today are ubiquitous, from social connections with and between groups of friends and acquaintances to business associations with co-workers and organisations. Members of networks, both as groups and as individuals, maintain ties and information exchange channels between themselves. Examining these connections on different levels paints an interesting picture of how information exchange processes operate. Relating micro-level relations with macro-level models when examining interactions has proven to be a productive way of bridging the gap between the two areas from a sociological perspective (Granovetter, 1973; 1982). Granovetter's work has brought to the forefront weak ties and their meaningful role in the dissemination of information within networks and his theory on the strength of weak ties has provided a foundation upon which many emerging perspectives are building (Friedkin, 1982; Marsden & Campbell, 1983; Feldman, 1987; Pickering & King, 1995; Constant et al., 1996; Wellman, 1992; Garton & Wellman, 1995; Haythornthwaite et al., 1995; Garton et al., 1997; Haythornthwaite, 1998).

    One way to study network dynamics is Social Network Analysis (SNA). It examines patterns of relationships between actors within their networks. Relationships and not, for example, social status, are used to group individuals and search for emerging patterns of information exchange between them. The proliferation of Computer-Mediated Communication (CMC) adds another dimension to social network analysis. Electronic mail, for example, is one of many tools being used and studied increasingly in relation to communication processes, particularly in an organisational context. These ideas take on a particular interest when applied to virtual organisations (defined in section 3).

    Electronic mediation of activities also produces brokerage effects (Kraut et al., 1998). Fernandez & Gould (1994) refer to the net-broker concept and hold that it revolves around the idea of one being in a position that connects otherwise disassociated actors in a network. It is a useful model for not only improving comprehension in creating analytical types, but for facilitating analysis of certain kinds of social activities.

    The way in which technologies are adapted by and used in an organisation is greatly dependent on the social context in which they are employed (Haythornthwaite, 2000). E-mail in particular helps to maintain and cultivate weak ties within and between networks (Feldman, 1987; Pickering & King, 1995). Granovetter (1973) and Feldman (1987) suggest that weak tie associations like e-mail have a conceivable effect on behaviour formation used to achieve information circulation within a network and its structure.

    The structure of this paper is as follows: first, we will give an overview of social network analysis, adding in the relevant issues of tie strength, and CMC. Next, we will examine virtual organisations. In particular, the concept of virtualisation, net-brokerage, and how the above topics apply in a virtual environment. Finally, we shall conclude with a discussion and suggestions for further research.

    2. SOCIAL NETWORKS

    A social network is a set of actors and relations occurring among them. Actors can be individual people, groups of people, objects or events as far as certain relations hold them all together. Each kind of resource exchange is considered a social network relation and actors maintaining the relation are said to maintain a tie. The strength of a tie may range from weak to strong depending on the quantity, quality and frequency of the exchanges between actors (Marsden & Campbell, 1984).

    2.1 Social Network Analysis

    The very idea of the social network approach is that relations or interactions between actors are the building blocks that sustain and define the network (Wellman, 1988; Wasserman & Faust, 1994). Typically, interactions between actors result from exchange of resources, either material or informational, such as goods, money, information, services, social or emotional support, trust, influence etc.. Patterns of who is tied to whom reveal the structure of the underlying network: they show how resources flow among actors and how actors are interconnected in the network. A few very well known examples of social network analyses are: Granovetter (1973, 1974) who investigated exchange of job information among acquaintances and found that weak ties are operationally strong for the diffusion of such information. Wilson (1997) also found that the urban poor in isolated Black ghettoes lack connections with sources of work. Finally, Burt (1992) studied the dependency of social capital on 'structural holes' (which are particular kinds of network positioning in which a focal actor is connected to other actors who themselves are not connected with one another); thus, according to Burt, social capital is not a direct attribute of actors but rather of their ability to sustain flexible configurations within a network.

    Computer networks and in particular the Internet, have clearly become social networks (Wellman et al., 1996). In these social systems, actors may be human, such as information producers and consumers, or non-human such as computer machines and multimedia resources. Relations among the human Internet actors refer to informative and communicative uses, access, provision, procurement, commerce, work, education etc. Although human actors are always beneath the non-human ones, typical relations among the latter consist of information (data) flows, traffic, exchanges of e-mails and postings in web pages, links, connections, network topologies etc.

    In this way, there are applications of social network analysis to study the Internet such as: Garton, Haythornthwaite and Wellman (1999) tried to assess the role of e-mail and desktop videoconferencing within the context of overall communication. Haythornthwaite (2000) also collected data from four computer-supported distance-learning classes in order to build a picture of the size and composition of personal online networks. Lastly, Haythornthwaite (2001) has studied the strength of interpersonal ties among new media communicants arguing that, when the medium changes, weak ties are more vulnerable to dissolution while strong ties remain more robust. Studies have found that weak ties sustained by only one form of media, such as e-mail, are in danger of being cut off if that media changes or becomes unavailable (Haythornthwaite, 2001). If only one channel of communication is available, it follows that a tie is susceptible to extinction should that channel be altered or taken away.

    2.2 Strong and Weak Ties

    Tie strength is dependent on the quantity, quality, and frequency of knowledge exchange between actors and can vary from weak to strong (Marsden & Campbell, 1984). Increased frequency of communication and deeper, more intimate connections characterise stronger ties. Strong social ties, for example, will be between close friends and family members, while weak ties exist between acquaintances and business associates. Strong ties are considered more useful in facilitating the flow of information between individuals (Haythornthwaite, 1996). Weak ties, on the other hand, are of greater importance in encouraging exchange of a wider variety of information between groups in an organisation (Granovetter, 1973; Friedkin, 1982). People with few weak ties within a community, according to Granovetter, will become isolated from receiving new information from outside circles and will be resigned to hear the same re-circulated information within their own clique comprised of close friends (Granovetter, 1982; Haythornthwaite, 2000). A weak tie link between strongly tied groups is referred to as a local bridge (Granovetter, 1973). A local bridge is a good example of weak ties in action. Weak ties contribute to social solidarity; the greater the number of local bridges in a community, the more cohesive the community (Granovetter, 1973).

    Weak and strong ties have different effects on the probability of information flow within a community. Weak ties are more effective in promoting the probabilities of exchange of resources with members of other departments within an organisation, while strong ties are more important for the probabilities of resource exchange for members of the same department (Friedkin, 1982). According to Friedkin (1982) the mix of weak with strong ties results in the highest probabilities of information exchange. From an organisational perspective, CMC adds various optional channels with which individuals may communicate. These functions underlie social structure, collaborative decision-making and problem solving within an organisation (Granovetter, 1973; Feldman, 1987).

    2.3 Computer-Mediated Communication and Social Context

    Circulation of information and knowledge is important within the bounds of an organisation. Knowledge in and of itself facilitates a deeper and clearer understanding of an organisation by its members. Altering communication channels changes the competence of the processes that set an organization into motion (Pickering & King, 1995). Exchange of information between members of an organisation and even between different organisations is often carried out informally. This method of sharing data also develops with the influence of the local culture and its needs (Haythornthwaite, 1996). The extent to which CMC is utilised within and between groups is largely dependent on both group and organisational influences (Garton et al., 1997).

    Communication mediums, however, need to be readily available to users in order to be truly adapted and assessed for their nature; if a resource is only partially accessible then frequency of use may be due not to the instrument itself but to other factors including accessibility. Along the same vein, if a system of communication is widely used then its adaptation becomes necessary for all wishing to communicate with members using this medium (Garton & Wellman, 1995). Haythornthwaite et al. (1995) refer to a study by Markus et al. (1992) which found accessibility of a medium and of individuals via that medium coupled with pressure from the local culture to adapt particular media influenced differences in organisational use of media such as e-mail, thus suggesting that group norms can dictate practice. In addition, when computer-mediated communication is employed, the way in which the information is shared depends greatly on the social context in which it is used. In a study by Haythornthwaite (2000) on groups of students participating in distance learning classes, it was found that looking at the profiles of groups of students who had varying frequencies of communication (from high to low) showed that different kinds of relations and media characterise ties. This is also illustrated in the way in which e-mail is adopted and utilised in organisations. Cliques with strong ties use more media to maintain their relations than do groups weakly tied to one another (Haythornthwaite, 2000).

    3. VIRTUAL ORGANISATIONS

    The definition of a virtual organisation in the literature varies, and has no uniform meaning. For example, a study done by Kraut et al. (1998, p. 2) suggests that "virtual organizing is a matter of degree." One definition of virtual organisations given by Laudon & Laudon is, "organisations using networks linking people, assets and ideas to create and distribute products and services without being limited by traditional organisational boundaries or physical location" (Laudon & Laudon, 2000). We will refer to this definition for the purposes of this paper.

    A firm may choose to go virtual for two main reasons. Greater efficiency gained by obtaining goods and services from specialised manufacturers (Davidow & Malone, 1992) is one. The second reason is that use of information technology will reduce transaction costs (Malone, Yates & Benjamin, 1987).

    The degree to which a company virtualises depends on what proportion of its important manufacturing procedures, for example, take place beyond conventional organisational boundaries (Kraut et al., 1998). There are pros and cons for a firm wanting to send activities outside its own walls. Different transaction costs will be incurred. If more than one specialised company offers its services, the most efficient one may be utilised, and the greater the number of offers, the less the chance of the firm falling prey to opportunistic behaviour (Kraut et al., 1998). However, going virtual creates new transaction costs to consider. Governance will come at a higher price when goods and services are bought in the open market rather than produced in-house (Williamson, 1975; 1985; 1996).

    3.1 Electronic Network Use and Coordination

    Any kind of computer or data network that allows the sharing of information between companies will be referred to as an electronic network (Kraut et al., 1998). Malone, Yates & Benjamin (1987) hold that electronic networks can help reduce the costs of governance. Malone et al. refer to the utilisation of electronic networks to increase the number of possible potential suppliers of a product or service as an electronic brokerage effect. This would also reduce the chances of the company facing opportunism (Kraut et al., 1998). Opportunism is not the only problem corporations face. Coordination problems also must be handled. It is argued that because electronic networks reduce the costs of coordination, organisations will therefore use them more often to coordinate processes and thus become more virtual (Malone et al., 1987). These arguments about governance and coordination costs extend to the notion that use of electronic networks will facilitate outsourcing for companies and as a result, they will become more virtual (Kraut et al., 1998).

    However, when organisations set up networks first internally and then move outward, they have better knowledge of business methods, are less susceptible to intrusion and can implement technical standards to guarantee congruency (Kraut et al., 1998). Findings by Kraut and colleagues (1998) suggest that increased use of electronic networks by corporations is associated with less virtualisation, not more.

    A strong complement to these e-networks is personal relationships. They are particularly valuable in coordinating complex business practices and help to build trust between members of a virtual firm; the formation of trust will also reduce the occurrence of opportunistic behaviour (Granovetter, 1985; Uzzi, 1997; Zucker, 1986). Most probably, these personal connections are in the form of weak rather than strong ties. Electronic management is more important for routine activities (Chan, 1997). In fact, Kraut et al. found that, "using electronic networks actually degraded the overall quality of the order process when firms failed to supplement network use with personal relationships (1998, p.20). Their data showed that personal relationships and electronic networks complement rather than substitute for one-another.

    3.2 Net-Broker Concept

    By suggesting the term of broker(age) as an entrance in analysing the social relations created by new media we hope to be able to advance the theoretical and practical understanding of the constitutive characteristics of knowledge societies. The term broker(age) has been defined in recent network analyses as "the occupancy of a structural position that links pairs of otherwise unconnected actors" (Fernandez & Gould, 1994). It resembles the idea of network actors or of "nodes: a person, group, organization, thing, event, and so on, linked to other in a network.... sometimes referred to as a node" (Emirbayer & Goodwin, 1994). In different historical periods types of brokerage emerge with considerable consequences both for organizational policies and strategies, as well as collective and individual actions. The advantage of such an approach is that it not merely enhances our theoretical understanding in creating analytical types but that it also makes possible a methodological translation of such categories to analyse specific types of actual social activities.

    Brokers can further be linked with one another into more or less complex systems and networks with more or less definable boundaries setting communicative "agendas". One may even think of the legal system from this point of view of a broker system as it falls upon the juridical system to translate sets of issues into practical-legal actions. In the study by Fernandez and Gould referred to earlier, five types of (structural) brokerage are distinguished: liaison, representative, gatekeeper, itinerant broker, and coordinator.

    The liaison is a brokerage relation in which all three actors occupy different groups. A typical example is the "arbitrator" between union and management negotiations (p. 1458). A second type of brokerage is the representative created "when one member of a subgroup takes it upon itself or is given the role of communicating information to, or negotiating exchanges with outsiders" (p. 1457). Such a situation is to be found when e.g. a leading firm of industry were to act as a spokesman for the rest of the industry in discussions with ethical committees or with the government. A third type is the gatekeeper role in which an "actor screens or gather resources from the outside and distributes them to members of his or her subgroup" (p. 1457). In the case of public policy, various relevant Ministries or else public associations often act in such gate keeping roles. The itinerant broker is the one where an intermediary actor mediates exchange of information between two principals belonging to the same subgroup. The fifth and last type of structural brokerage is found in a situation where all three actors belong basically to the same group. Fernandez & Gould label this type a "local broker" or "coordinator".

    4. DISCUSSION

    We have examined social networks, their analysis and the interplay of weak and strong ties within systems for knowledge exchange. We have also looked at electronic networks as social networks for information exchange and brokerage effects that may aid operations. When an organisation chooses to go virtual, it is more effective to observe the degree of virtualisation rather than a black or white view of virtual or not. The helpful personal relationships that Kraut et al. found balance use of electronic networking are weak ties in action. More to the point, they play the role of local bridges between strongly tied groups (each collaborating organisation).

    Social network analysis is a valuable tool for understanding how information makes its way from one member to the next within a single corporation and between networked firms. With an improved understanding of how communication channels develop within and between organisations, information specialists will be better equipped to alter routes of knowledge exchange for the improved communication between networked individuals (Haythornthwaite, 1996).

    Weak ties are necessary to prevent fragmentation of communities and facilitate the spread of new ideas (Granovetter, 1982). Findings by Kraut and colleagues (1998) support the idea that weak ties are facilitators of information exchange, particularly when electronic networks are being used. Our understanding of the many facets of CMC within a work-context will deepen as more research is done in the area of CMC and organisations.

    On a theoretical level, it remains unclear how utilisation of electronic networks relates to the use of personal relationships and the degree of virtualisation (Kraut et al., 1998). On one hand, governance and coordination of activities are vulnerable to human error when these actions rely on personal relationships; on the other hand, these personal ties may lead to reduced costs for governance and coordination if they pave the way for trust formation and exchange of favors (Kraut et al., 1998). Furthermore, empirical findings are limited, and the dominant theory in the literature is that use of electronic networks leads to increased efficiency and therefore greater satisfaction of suppliers with which they are used (Kraut et al., 1998). The underlying assumption here is that governance and coordination are more complicated between organisations than within the same company and that electronic networks close this gap. The problem with this logic is that traditionally, organisations test things out first inside their own walls and then extend them outside. In this instance, use of electronic networks within a firm will lead to increased know-how of business practices and opportunity for standardisation of routine activities. If this happens, then use of electronic networks within a corporation should lead to greater internalization of production, and therefore less virtualisation (Kraut et al., 1998).

    A suggestion for further research into this area is to consider the social characteristics of people, what resources are made available to them in line with their position in the organisation, the interaction between current on and off-line relationships as well as social relationships and how they function in relation to electronic networks (Wellman et al., 1996).

    References

    Burt, R. (1992). Structural Holes. Chicago: Chicago University Press

    Callon, M. (1986). The sociology of an actor network. In M. Callon, J. Law & A. Rip (eds.), Mapping the Dynamics of Science and Technology. London: Macmillan.

    Chan, A.P. (1997). Coordination and control of retailer-supplier transactions: Factors influencing organisational adoption and use of electronic information networks. Unpublished Doctoral Dissertation. East Lansing, MI: Michigan State Universtity.

    Collins, H.M. (1994). Bruno Latour: We Have Never Been Modern. Isis, vol. 85, no. 4, pp. 672-674.

    Constant, David, Sproull, Lee, & Kiesler, Sara. (1996) The kindness of strangers: The usefulness of electronic weak ties for technical advice. Organization Science, Vol. 7, No. 2, March-April 1996, 119-135.

    Davidow, W., & Malone, M. (1992). The virtual corporation. New York: Harper.

    Emirbayer, M., & Goodwin, J. (1994). Network analysis, culture, and the problem of agency. American Journal of Sociology, vol. 99, 1411-1454.

    Feldman, Martha S. (1987) Electronic mail and weak ties in organizations. Office: Technology and People, 3, 83-101

    Fernandez, Roberto M. & Gould, Roger V. (1994) A Dilemma of state power: Brokerage and influence in the national health policy domain. American Journal of Sociology, Vol 99, Issue 6 (May 1994), 1455-1491.

    Friedkin, Noah E. (1982) Information flow through strong and weak ties in intraorganizational social networks. Social Networks, 3, 273-285.

    Garton, Laura & Wellman, Barry (1995) Social impacts of electronic mail in organizations: A review of the research literature. Communication Yearbook, 18, 434-453.

    Garton, L., Haythornthwaite, C., & Wellman, B., (1997) Studying online social networks. JCMC 3 (1) June 1997

    Garton, L., Haythornthwaite, C., & Wellman, B. (1999). Studying on-line social networks. In S.G. Jones (ed.), Doing Internet Research: Critical Issues and Methods for Examining the Net, pp. 75-105. Thousand Oaks, CA: Sage.

    Granovetter, M. (1973) The strength of weak ties. American Journal of Sociology, 78, 1360-1380.

    Granovetter, M. (1974). Getting a Job. Cambridge, MA: Harvard University Press.

    Granovetter, M. (1982) The strength of weak ties: A network theory revisited. In Peter V. Marsden and N. Lin (Eds.), Social structure and network analysis. Sage.

    Granovetter, M. (1985). Economic action and social structure: The problem of embeddedness. American Journal of Sociology, 91 (3), 481-510.

    Haythornthwaite, C., Wellman, B., & Mantei, M. (1995). Work relationships and media use: A social network analysis. Group Decision and Negotiation, 4, 193-211.

    Haythornthwaite, Caroline (1996). Social network analysis: An approach and technique for the study of information exchange. LISR 18, 323-342

    Haythornthwaite, Caroline (1998) A social network study of the growth of community among distance learners. Conference paper for IRISS 1998 in Bristol, UK.

    Haythornthwaite, Caroline (2000). Online personal networks. New Media and Society, Vol 2 (2), 195-226.

    Haythornthwaite, C. (2001). The strength and the impact of new media. In the Proceedings of the IEEE Hawaii International Conference On System Sciences, January 3-6, 2001, Maui, Hawaii.

    Kraut, R., Steinfeld, C., Chan, A., Butler, B., & Hoag, A., (1998) Coordination and virtualisation: The role of electronic networks and personal relationships. JCMC 3 (4), June 1998,

    Latour, B. (1987). Science in Action. Cambridge, MA: Harvard University Press.

    Laudon, Kenneth C. & Laudon, Jane P. (2000) Management information systems. Organization and technology in the networked enterprise. Prentice Hall International, Inc. Sixth Edition.

    Malone, T., Yates, J., & Benjamin, R. (1987). Electronic markets and electronic hierarchies: Effects of information technology on market structure and corporate strategies. Communications of the ACM, 30, 6, 484-497.

    Markus, L.M., Bikson, M. El-Shinnawy, & L.L. Soe. (1992). Fragments of your communication: Email, vmail and fax. The Information Society 8, 207-226.

    Marsden, Peter V. & Campbell, Karen E. (1983) Measuring tie strength. Paper presented at the 1983 meeting of the American Sociological Association in Network Analysis session.

    Marsden, P., & Campbell, K.E. (1984). Measuring tie strength. Social Forces, vol. 63, pp. 482-501.

    Pickering, Jeanne M. & King, John Leslie. (1995) Hardwiring weak ties: interorganizational computer-mediated communication, occupational communities, and organizational change. Organization Science, Vol. 6, No. 4, July-August 1995, 479-486..

    Uzzi, B. (1997). Social structure and competition in interfirm networks: The paradox of embeddedness. Administrative Science Quarterly, 42 (March), 35-67.

    Wasserman, S., & Faust, K. (1994). Social Network Analysis: Methods and Applications. Cambridge, UK: Cambridge University Press.

    Wellman, Barry. (1992) Which types of ties and networks provide what kinds of social support? Advances in Group Processes, Vol 9, 207-235.

    Wellman, B., Salaff, J., Dimitrova, D., Garton, L., Gulia, M., & Haythornthwaite, C., (1996) Computer networks as social networks: Collaborative work, telework, and virtual community. Annual Review of Sociol.ogy 1996, 22, 213-238.

    Wellman, B. (1988). Structural analysis: From method and metaphor to theory and substance. In B. Wellman & S.D. Berkowitz (eds.), Social Structures: A Network Approach, pp. 19-61. Cambridge, UK: Cambridge University Press.

    Williamson, O. (1975). Markets and hierarchies: Analysis and antitrust implications. New York: Free Press.

    Williamson, O. (1985). The economic institutions of capitalism. New York: Free Press.

    Williamson, O. (1996). Economic organization: The case for candor. Academy of Managemenet Review, 21(1), 48-57.

    Wilson, W.J. (1997). When Work Disappears: The World of the New Urban Poor. New York: Alfred A. Knopf.

    Zucker, L. (1986). Production of trust: Institutional sources of economic structure: 1840-1920. In B. Staw & L. Cummings, (Eds.), Research in organizational behavior. (Volume 8, 53-111). Greenwich, CT: JAI Press.


    Polkehn, Knut ; Institution: Institut für Psychologie, Humboldt-Universität zu Berlin
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Von Software zu Webware: Web-Usability Engineering."


    Preckel, Franzis ; Thiemann, Helge Institution: Psychologisches Institut IV, Westfälische Wilhelms-Universität Münster
    Article (version: 25/06/2002 - 07:47, size: 15520)
    "Testing intellectual giftedness on the Web: Development of a new Figural Matrices Test – online versus paper-and-pencil-version."
    German:

    1. Introduction

    Computer assisted testing (CAT) offers the advantages of increased standardization and economy of test applications. Online tests via internet can be seen as a special case of computer assisted testing which bears new opportunities and risks for psychometric assessment. Wilhelm and McKnight (2000) stress the lack of person mediated communication (e.g. comprehension of the test instruction) and the reduction in experimental control (e.g. self selection of the participants, use of auxiliary means) as the two main sources of distinctiveness between CAT and online-testing. One can find numerous tests on the internet but many of them are at best suitable for amusement and cannot be considered as valid assessment tools. In this paper we would like to examine the equivalence of a paper-and-pencil- (P&P) and an online-version of a newly developed figural matrices test for the assessment of intellectual giftedness (HBMT, HochbegabungsMatrizenTest). To our knowledge at present, there is no assessment tool available in Germany that is suitable for the assessment of high intellectual ability. Existing tests suffer from the problem of ceiling effects and the reliability of the measurement is not guaranteed for high scoring subjects. Quantitative differences between average and high intellectual ability are best identified with item-material loading high on the g-factor (Robinson & Janos, 1987; Rost, 2000). In factor-analytic studies, figural matrices tasks show mean loadings of .80 on the g-factor (Jensen, 1998). Several different research approaches demonstrate that figural matrices tests measure processes that are central to analytic intelligence (e.g. Carroll, 1993; Marshalek, Lohman & Snow, 1983). Therefore this item type seems to be especially suitable for the differentiation between average and high intellectual ability

    The equivalence of CAT- and P&P-versions can be examined under the aspects of quantitative and qualitative equivalence (van de Vijver, 1994). Whereas qualitative equivalence refers to construct validity, quantitative equivalence addresses mainly the question whether the norm data of one test version can be applied to the other test version. A meta-analytic study on the equivalence of CAT- and P&P-cognitive ability tests by Mead and Drasgow (1993) which included 159 studies found that for timed-power-tests (tests without time constraints or very generous time allocations) both aspects of equivalence are met if the CAT-version is an exact copy of the P&P-version. Wilhelm and McKnight (2000) examined the equivalence of P&P- and online-tests of deductive reasoning tasks. Results showed that reliable and valid data could be collected with online-tests for the item type under study. In addition, the influence of test modality was examined by the application of a mixture distribution Rasch-model to the whole dataset (P&P- and online-data). No significant correlation was found between modality and class membership of the participants, indicating "that the administration method has no substantial influence on the answer patterns participants generate under different administration methods ..." (Wilhelm & McKnight, 2000, pp.13-14). Item construction of the HBMT was based on a rule taxonomy. Therefore, the equivalency of both test modalities of the HBMT can be examined under a qualitative aspect referring to the internal structure of the data. The internal structure is defined by the generating principles underlying item construction. The examination of the quantitative equivalence of online- with P&P-tests proves to be problematic because comparability of the samples working on different versions can only be realized in an at least quasi experimental setting.


    2. Rule-based item-construction

    According to Carpenter, Just and Shell´s (1990) processing theory of matrix completion tasks two cognitive processes are relevant for task solution: correspondence finding which is based on abstraction capacity and goal-management which involves working memory capacity. Abstraction capacity is assumed to be equally required in matrix completion tasks (Embretson, 1995). The working memory load is influenced by task complexity that is determined by three features: number and kind of the sub problems as well as distinctiveness of the sub problems (Carpenter et al., 1990; Vodegel Matzen, 1994; Embretson, 1998). Carpenter et al. (1990) show that problem solvers build up a complete representation of all elements of a task by successively working on the different sub-problems. With a growing number of sub-problems, working memory load and task difficulty increase, because the problem solver has to decompose the task into sub problems and manage the various solutions.

    The item construction of the HBMT was mainly based on the findings of Carpenter et al. (1990) and on studies referring to their research results (Embretson, 1998; Vodegel Matzen, 1994). All of these studies find that the number of sub problems or rules is the most important determinant of task difficulty. Tasks with multiple rules require the problem solver to identify which figural elements of the task are determined by the same rule. This process of correspondence finding is made more difficult by ambiguous stimuli. Drawing features like overlay or fusion of figural elements cause ambiguity in the distinctiveness of figural elements. Table 1 presents the types of rules and the drawing features used in the HBMT-tasks.

    3. Method

    Twenty six matrices completion tasks were generated, which contain two up to five rules. The items consist of 16 entries, arranged in a 4x4 matrix. The target entry in the lower right corner was left blank. Each item has nine answer alternatives: the correct solution, seven distractors and the alternative "no alternative correct" to prevent a falsificatory exclusion strategy (Gittler, 1989). The distracters were build systematically and contain one or more rule omissions (1, ..., a-1 where a = number of rules). The items were roughly ordered with respect to the number of rules. Before working on the 26 items, the participants worked on 11 trial tasks where all rules were explained in detail. There were no time constraints allotted. Data was collected by a paper-and-pencil- (P&P) and by an online-version. Both versions were supplemented by questionnaires on demographic data. The adaptation of the online-version preserved the similarity between both test versions as far as possible.

    4. Results

    Item difficulties show a mean of .59 for the P&P-version and of .69 for the online-version. Item discrimination (point-biserial) yields a mean of .36 for both test versions. Item slopes of the standardized slope of the item characteristic curve of a two parameter IRT model show a mean of .64 for the P&P-version and respectively .72 for the online-version. An internal consistency (Cronbach´s alpha) of .83 was estimated for both versions. The split-half reliability (equal length Spearman-Brown) is .81 for the p&p-version and .83 for the online-version. The results (raw score) in both versions were correlated to diverse criteria. Correlations are shown in table 3.

    The size of the correlations was checked for differences between both samples by Fisher-Z-transformation. The only significant difference between both samples was found for the correlation of sex and score (Fisher's Z=.286, p=.00). Whereas there is no correlation between sex and score for the p&p-sample the 81 woman who took part in the online-test tended to score lower. Research shows that there are no differences in aptitude to solve matrix completion tasks between men and women (e.g. Mills & Tissot, 1995). Therefore, the finding of women in the internet sample scoring lower is not representative for the item type under study. It is unclear how to explain this result and numerous confounding factors might play a role here.

    Psychometric quality was also assessed by fitting alternative IRT-models to the data. The fit of different models can be estimated by a comparison of the geometric mean of the marginal maximum likelihood of the different models (Rost, 1996). Differences between the models for both samples were not very striking, but the 2PL-model tends to fit the data better than the 1PL-model. The 3PL-model does not improve model fit compared to the 2PL-Model. In addition model fit can be assessed by information criteria or so called penalty functions because they take the number of estimated parameters (AIC-index) and the sample size (BIC-index) into account. The lower the index-value the better the model fits the data.

    The rank correlation (Spearman) for the 2PL-item difficulties between both versions is r=.94, which indicates that both versions have a comparable order of item difficulties.

    To assess the impact of the generating item structure on item difficulty, a multiple regression with item difficulty of the 2PL-model as dependent variable and frequencies of each rule type and a variable for drawing features as independent variables was calculated. The 2PL-item difficulties are normally distributed. The regression yielded a significant effect of item structure for both the p&p-version, F(6, 18)= 6.20, p<.00, and the online-version, F(6, 18)= 8.02, p<.00. The multiple correlation is R=.82 for the p&p-version and R=.85 for the online-version (corrected R2: p&p .57, online .64) indicating that item difficulty can be predicted well by the generating item structure.


    5. Discussion

    The psychometric properties of the online version proved to be satisfactory compared to the properties of the p&p-version. Item discrimination, reliability and convergent validity are high in both versions. The high correlation between the estimated 2PL-item parameters for both versions indicates that the order of item difficulties is nearly equal. The item difficulty can very well be predicted by the generating item structure. According to the results of Mead and Drasgow (1993), the absence of time constraints and maximal similarity (identity besides modality) between test versions contribute to the equivalence of the CAT- and p&p-version of a test. Both conditions were fulfilled for the online- and p&p-HBMT. Moreover, participants received identical written instructions and trial tasks where all possible item components like rules or rule direction were explained and exercised. Even if the participants of the online-version did not read the instructions carefully, they had to work on the eleven example tasks before working on the scored tasks. Therefore, it is likely that they were familiar with the task demands when working on the test. In addition, the good results from the online sample prove that the participants must have understood the instructions. The explanation of the item components in advance has several advantages: In the first place, test fairness is enhanced because participants have comparable conditions with respect to their knowledge of task principles. Secondly, the rule based item construction and the training of item-components ensures that the correct solution can be identified unambiguously. Last but not least, it can be argued that the knowledge and training of the task components circumscribe the (mixture of) latent factor(s) responsible for the answers participants produce. This leads to a reduction of error variance and improves the interpretation of results.

    Nevertheless, the absolute difference in item difficulty proved to be problematic. The participants of the online-version had a significantly higher score than the participants of the p&p-version (Mann-Whitney-U=30423,5, Z=-6.21, p<.00). This can be explained by sampling effects and the test taking situation: the online-sample was highly motivated and self selected and it might be reasonable to assume that many of the online participants have some experiences in (online) test taking. Moreover, there was no experimental control of the use of auxiliary means. The purpose of collecting numerous data via internet with gifted samples was not served in the study presented here. Despite the fact that over 20.000 different computers accessed the online-test, only 358 persons worked through the whole test. The presented test was quite time consuming and although it could be completed offline, the time investment and the unchanged item type imposed great demands on the motivation and patience of the participants. The use of shorter and more varied tasks seems to be more profitable for online-assessment.


    6. References

    Andersen, E. B. (1973). A goodness of fit test for the Rasch model. Psychometrika, 38, 123-140.

    Carpenter, P.A., Just, M.A., & Shell, P. (1990). What one intelligence test measures: A theoretical account of the processing in the Raven Progressive Matrices Test. Psychological Review, 97, 404-431.

    Carroll, J.B. (1993). Human cognitive abilities: A survey of factor-analytic studies. Cambridge, MA: Cambridge University Press.

    Embretson, S. (1995). The role of working memory capacity and general control processes in intelligence. Intelligence, 20, 169-189.

    Embretson, S. (1998). A cognitive design system approach to generating valid tests: Application to abstract reasoning. Psychological Methods, 3, 380-396.

    Gittler, G. (1990). Dreidimensionaler Würfeltest. Ein Rasch-skalierter Test zur Messung des räumlichen Vorstellungsvermögens. Testmanual. Beltz Test.

    Hornke, L.F., & Habon, M. (1984). Regelgeleitete Konstruktion und Evaluation von nicht-verbalen Denkaufgaben. Wehrpsychologische Untersuchungen, 19, 1-153.

    Jensen, A. (1998). The g-factor: The science of mental ability. Westport, CT: Praeger.

    Marshalek, B., Lohman, D. F., & Snow, R.E. (1983). The complexity continuum in the radex and hierarchical models of intelligence. Intelligence, 7, 107-127.

    Mead, A. D., & Drasgow, F. (1993). Equivalence of computerized and paper-and-pencil cognitive ability tests: A meta-analysis. Psycgological Bulletin, 114, 449-458.

    Mills, C. J., & Tissot, S. L. (1995). Identifiying academic potential in students from under-represented populations: Is using the Ravens Progessive Matrices a good idea? Gifted Child Quarterly, 39, 209-217.

    Raven, J. C. (1962). Advanced Progressive Matrices, Set II. London: H. K. Lewis.

    Robinson, N. M., & Janos, P. M. (1987). The contribution of intelligence tests to the understanding of special children. In J.D. Day & J.B. Borkowski (Eds.), Intelligence and exceptionality: New directions for theory, assessement, and instructional practices (pp. 21-56). Ablex Publishing Corporation.

    Rost, D. H. (Hrsg.) (2000). Hochbegabte und hochleistende Jugendliche. Münster: Waxmann.

    Rost, J. (1996). Lehrbuch Testtheorie, Testkonstruktion. Göttingen: Huber.

    Vodegel Matzen, L. B. L., van der Molen, M. W, & Dudink, C. M. (1994). Error analysis of Raven test performance. Personality and Individual Differences, 16, 433-445.

    Ward, J., & Fitzpatrick, F. (1973). Characteristics of matrices items. Perceptual and Motor Skills, 36, 987-993.

    Wilhelm, O., & McKnight, P. E. (2000). Ability and achievement testing on the world wide web. Unpublished Manuscript. University of Mannheim, University of Washington.


    Rager, Michael ; Weichbold, Martin Institution: {}
    Article (version: 25/06/2002 - 07:47, size: 16770)
    "WWW-Surveys: Erhöhung der Bearbeitungsquote durch Fragebogengestaltung?"
    German: Michael Rager
    Martin Weichbold (Institut für Kultursoziologie der Universität Salzburg)

    WWW-Surveys: Erhöhung der Teilnahmerate durch Fragebogengestaltung?

    1. Einleitung

    Während Befragungen via Internet immer mehr Verbreitung finden und auch ihre technische Umsetzung zusehends aufwendiger und raffinierter wird, gibt es über die methodischen Eigenarten dieser Befragungsart bislang erstaunlich wenig Erkenntnisse. Eine systematische Grundlagenforschung zu einer sozialwissenschaftlichen Methodologie von Internetbefragungen ist nur bruchstückhaft auszumachen. Zu einem wesentlichen Teil liegt das wohl darin begründet, dass die Internetforschung bislang kaum akademisch etabliert ist, sondern überwiegend anwendungsorientiert von Unternehmen mit kommerziellem Interesse betrieben wird.

    Die gegenständliche Untersuchung ist ein Versuch, einen Beitrag zu diesen Grundlagen zu leisten. Konkret ging es darum, welche Einflüsse die Ankündigung und die Gestaltung eines Fragebogens auf die Rekrutierung der Teilnehmer und die Abbruchrate während der Befragung hat. Beide Fragen betreffen ja typische Problemstellungen bei Internetbefragungen, die jedoch aus unserer Sicht bislang nur unzureichend beantwortet wurden. Das Projekt wurde im Rahmen einer Diplomarbeit am Institut für Kultursoziologie der Universität Salzburg durchgeführt.

    2. Untersuchungsdesign

    Das Projekt war so angelegt, dass ein Fragebogen zur Evaluierung des Internetauftrittes der Fremdenverkehrsbetriebe der Stadt Salzburg in vier Variationen gestaltet wurde. Alle vier Variationen waren bezüglich Abfolge und Formulierung der (je nach Filterführung rund) 14 Fragen identisch, unterschieden sich aber in der Ankündigung und der formalen Gestaltung. Identisch war auch die Stelle auf der Homepage, von der aus der Fragebogen über einen kurzen Ankündigungstext verlinkt war; welche Fragebogenversion sich dahinter verbarg, wurde bei jedem Aufruf der Homepage per Zufallsgenerator ausgewählt und lag somit nicht im Einfluss des Besuchers. Die vier Versionen waren - wie die zu evaluierende Homepage selbst - jeweils in deutscher und englischer Sprache verfügbar und im Zeitraum von Juli 2000 bis Januar 2001 online.

    Version eins betraf den Ankündigungstext: eine Fragebogenversion war auf der Homepage als "Gewinnspiel" angekündigt, am Startbildschirm der Befragung erfuhr der Besucher, dass er zuerst ein paar Fragen zu beantworten habe, bevor er "Salzburg-Cards" gewinnen konnte. Der Fragebogen selbst war mit einer Frage pro Screen gestaltet.

    Die drei anderen Versionen wurden gleichlautend als "Umfrage: wie gefällt Ihnen SalzburgInfo?" angekündigt. Version zwei wurde als durchgängiger Fragebogen im Paper&Pencil-Design gestaltet, bei der die Daten erst mit einem Submit-Button am Ende des Fragebogens gemeinsam abgeschickt wurden. Die beiden restlichen Variationen folgten wie die Version eins ("Gewinnspiel") dem Prinzip "One Screen - one Question", auch die Seitenformatierung war dieselbe. Die Unterschiede lagen hier im Feedback: bei Version drei wurde nach jeder Antwort eine Grafik mit dem aktuellen Zwischenergebnis zur entsprechenden Frage eingeblendet (Echtzeitstatistik), um die Motivation zum Weitermachen zu erhöhen. In der Version vier wurde der Versuch, eine Frage zu überspringen, mit einer höflichen, aber bestimmten Aufforderung, diese erst zu beantworten, verhindert.

    Zweck des gewählten Untersuchungsdesigns waren zum einen Erkenntnisse über Unterschiede in der Teilnahmerrate zwischen jenen Versionen, die als Umfrage und jener, die als Gewinnspiel angekündigt war und in der Abbruchrate während der Befragung zwischen allen vier Fragebogen-Variationen, wobei für die Paper&Pencil-Version nur die Relation von angeforderten und zurückgesendeten Fragebögen angegeben werden kann.

    3. Ergebnisse

    3a. Teilnahmemotivation durch Fragebogenpräsentation
    Hinsichtlich des Einflusses der Fragebogenankündigung und der damit verbundenen unterschiedlichen Teilnahmemotivation ergaben sich folgende Ergebnisse: Insgesamt griffen im Untersuchungszeitraum 170.265 Personen auf die Homepage der Fremdenverkehrsbetriebe der Stadt Salzburg zu und hatten so grundsätzlich die Möglichkeit, an der Fragebogenerhebung durch einen einfachen Mausklick auf den Link zum Fragebogen teilzunehmen. Von dieser Personengruppe klickten 768 Personen auf den Link zum Fragebogen, also rund jeder 220. Besucher. Das entspricht einer Zugriffsrate auf den Fragebogen von lediglich rund einem halben Prozent.

    Wie erwartet war die Zugriffsquote bei der Ankündigung als "Gewinnspiel" deutlich höher:

    Während die Ankündigung "Umfrage" lediglich eine Zugriffsrate von rund 0,39 Prozent erreichte, wurde das Gewinnspiel von rund 0,78 Prozent der Besucher der Homepage angeklickt. Mit anderen Worten: rund jeder 128. Besucher, dem eine Gewinnmöglichkeit in Aussicht gestellt wurde, klickte den Hyperlink an, aber nur rund jeder 257. Besucher, der um die Teilnahme an der Umfrage gebeten wurde. Dies bedeutet, dass mit der "Gewinnspiel"-Ankündigung eine doppelt so hohe Teilnehmerquote erreicht werden konnte.

    Aber auch im weiteren Befragungsverlauf stellte sich die unterschiedliche Ankündigung als zentraler Faktor zur Motivation der Befragten heraus. Vom Link auf der Homepage gelangte man zunächst zur Startseite der Befragung, mit einem weiteren Klick schließlich zur ersten Frage. Von den 768 Besuchern, die über den Link auf der Homepage zum Startscreen gelangt waren, setzten 686 Personen oder knapp 90 Prozent die Befragung fort, indem sie mindestens eine Frage beantworteten. Neuerdings ist hier der Anteil unter jenen, die sich als Gewinnspielteilnehmer sahen, mit 95% gegenüber 87% bei den Umfrageteilnehmern deutlich höher.

    3b. Präsentationseffekte auf die Abbruchrate
    Dieses voneinander abweichende Bearbeitungsverhalten der Untersuchungspersonen der beiden Fragebogenvariationen "Umfrage" bzw. "Gewinnspiel" lässt sich dann auch in der Analyse der Abbruchrate im Interviewverlauf beobachten. Insgesamt zeigte sich dabei ein aus anderen Befragungen in Computerumgebungen vertrautes Bild:

    So trat ein Großteil der Fragebogenabbrüche bereits nach den ersten beiden Fragen im Interviewverlauf auf (über 40 Prozent der Befragten!), während die Abbrecherquote nach erfolgter Beantwortung dieser beiden Einstiegsfragen immer geringer wird. Entsprechend reduziert sich die Zahl der gültigen Antworten zunächst sehr stark, um dann in weiterer Folge des Interviews nur mehr leicht abzunehmen. Insgesamt beantworteten bei der Untersuchung lediglich 38 Prozent der Teilnehmer alle Fragen.

    Im Mittelpunkt des Interesses stehen an dieser Stelle aber die deutlichen Unterschiede zwischen den Fragebogenvariationen, wobei sich auch hier die Ankündigung als zentraler Faktor herausstellt.

    Die formalen Variationen in der Fragebogengestaltung ergaben hingegen deutlich geringere Effekte. Brachen von den Probanden, die den Fragebogen auf der Startseite in Erwartung einer Umfrage angewählt hatten (und somit von der Existenz eines Gewinnspiels nicht vor der vollständigen Beendigung der Befragung informiert wurden) über ein Drittel die Befragung bereits bei der ersten Frage ab, erfolgte ein vorzeitiger Abbruch durch die Gewinnspiel-Teilnehmer in weitaus geringerem Ausmaß: Lediglich 15,6 Prozent dieser Gruppe beendetet ihre Mitarbeit schon nach dem Eröffnungsbildschirm. Nach der zweiten Fragen waren nur noch weniger als die Hälfte der Umfrageteilnehmer, aber fast drei Viertel der Gewinnspielteilnehmer an Board. Im weiteren Verlauf sind dann nur mehr geringe Unterschiede zwischen den Fragebogenversionen festzustellen, wie am annähernd parallelen Verlauf der Linien zu erkennen ist. Am Ende haben über die Hälfte der Untersuchungsteilnehmer, die den Fragebogen in der Gewinnspiel-Variation präsentiert bekamen, die Befragung auch bis zum Schluss vollständig bearbeitet. Demgegenüber hat lediglich rund ein Viertel der Personen, die den Fragebogen ohne diese Information über das Gewinnspiel vorgelegt bekamen, alle Fragen ausgefüllt. Wie erwähnt, resultiert dieser Unterschied überwiegend aus der Abbruchrate in den ersten beiden Fragen.

    Gruppiert man die Befragungsteilnehmer in solche, die spätestens nach Beantwortung der ersten Frage die Befragung abbrachen, jene die im weiteren Lauf der Befragung abbrachen und jene, die alle Fragen beantworteten, so zeigt sich folgende Ungleichverteilung:

    Deutlich kommen hier die Unterschiede zwischen den beiden Ankündigungstexten des Fragebogens ans Licht: Während der Anteil der Unterwegsabbrecher annährend gleich ist, ergibt sich bei den Sofort- bzw. Nichtabbrechern deutliche Differenz: während beim Gewinnspiel das Verhältnis jener Personen, die die Befragung gleich zu Beginn beendet haben zu jenen, die alle fragen beantwortet haben 1 : 2 beträgt, ist es bei den Umfrageteilnehmern genau umgekehrt. Berücksichtigt man dazu noch die doppelt so hohe Teilnehmerrate beim Gewinnspiel, bedeutet das: die Wahrscheinlichkeit, mit der Ankündigung "Gewinnspiel" einen komplett beantworteten Fragebogen zu erhalten, ist vier mal so groß wie mit der Ankündigung einer Umfrage.

    3c. Gestaltungseffekte auf die Abbruchrate
    Die Abbruchrate zwischen den als Umfrage angekündigten Fragebogenversionen ist im Vergleich zum Ankündigungseffekt deutlich geringer. Das von uns als Motivation gedachte Feedback in Form der Echtzeitstatistik nach jeder Frage erwies sich sogar als kontraproduktiv und erbrachte die höchste Abbruchrate. Dies ist wohl mit der längeren Ladezeit - nach jedem Fragen-Screen wurde automatisch eine Datei mit dem Zwischenergebnis geladen - zu erklären. So dauerte die mittlere Bearbeitungszeit für den gesamten Fragebogen in dieser Version mit über 15 Minuten doppelt so lang wie bei den anderen One-Screen-One-Question-Versionen.

    Die "traditionelle" Paper&Pencil-Version kann sich dagegen bezüglich der Bearbeitungsrate (hier nur im Verhältnis von angeforderten und zurückgesendeten Fragebögen anzugeben) mit den "modernen" Gestaltungsformen ohne weiteres messen, sie schneidet sogar geringfügig besser ab:


    Auf 100 Befragte kommen bei der Paper&Pencil-Version 36 zur Gänze beantwortete Fragebögen, bei der Eingabeaufforderung 32 und bei der Echtzeitstatistik lediglich 23. Zu berücksichtigen ist dabei freilich, dass bei den beiden zuletzt genannten Versionen die Angaben der Befragungsabbrecher - soweit sie vorliegen - verarbeitet werden können. Bei Paper&Pencil-Fragebögen liegen hingegen, abgesehen von fehlenden Angaben zu einzelnen Fragen nur vollständige Datensätze vor.


    4. Schlussfolgerungen

    Zusammenfassend lässt sich also vorerst festhalten, dass sich vor allem mit der Ankündigung als Gewinnspiel eine deutlich höhere Teilnehmerrate erzielen ließ als mit der Umfrage. Die Aussicht auf einen möglichen Gewinn erhöhte offenbar die Aufmerksamkeit und verdoppelte die Zahl jener, die den Link anklickten. Aber auch die Abbrecherrate im Interviewverlauf sank deutlich. Die anderen Variationen hatten deutlich weniger Einfluss auf die Abbrecherrate, die Echtzeitstatistik hatte sogar negative Auswirkungen auf die Bearbeitungsrate.

    Mit der Ankündigung eines Gewinnspiels oder anderen Maßnahmen die Motivation potentieller Teilnehmer (mit anderen Worten: deren Zentralität) zu erhöhen, um damit eine größere Stichprobe zu realisieren, liegt angesichts dieser Ergebnisse nahe. Diese Vorgangsweise ist allerdings nicht unproblematisch, wenn man nicht nur Teilnehmer- bzw. Abbrecherzahlen vor Augen hat, sondern auch deren spezifisches Antwortverhalten berücksichtigt.

    Wie sich auch in einer Vergleichsstudie bestätigt hat, ist zunächst ein deutlicher, direkt proportionalen Zusammenhang zwischen dem Abbruchverhalten und dem Antwortverhalten bei Bewertungsfragen festzustellen. Ohne darüber zu spekulieren, welcher der beiden Faktoren abhängig, welcher unabhängig ist: Personen, die einen Fragebogen bis zur letzten Frage beantworten, geben positivere Antworten auf Bewertungsfragen, als jene, die während des Interviews abbrechen. Oder umgekehrt: bei Personen, die eine positivere Einstellung zum Befragungsgegenstand haben, besteht eine größere Wahrscheinlichkeit, dass sie diese Befragung auch zu Ende führen. Dieser Umstand ist auch in der Diskussion zu berücksichtigen, wie man generell mit Interviewabbrechern umgeht. Da diese, wie gesehen, meist in einer Anfangsphase des Interviews vorkommen, gibt es Vorschläge, mit den thematisch relevanten Fragen erst nach einer Warm-up-Phase zu beginnen; angesichts des deutlichen Zusammenhanges zwischen Abbruchverhalten und Bewertungen erscheint das als eine nicht unproblematische Vorgangsweise.

    Vor diesem Hintergrund sind nun auch Maßnahmen zur Erhöhung der Zentralität durch Anreize (etwa das erwähnte Gewinnspiel) zu sehen: damit erhöht man nicht nur die Teilnehmerquote und das Durchhaltevermögen der Befragten, sondern bewirkt auch ein geändertes Antwortverhalten: wiederum werden auf Bewertungsfragen positivere Antworten gegeben.

    Bei der gegenständlichen Untersuchung wurden zu Beginn des Fragenkatalogs vier Fragen zur Bewertung der Homepage gestellt. Bei den fünfstufigen Antwortskalen lagen die Mittelwerte der "Gewinnspiel"-Teilnehmer zwischen 0,28 und 0,46 unter jenen der "Umfrage"-Teilnehmer (also eine positivere Bewertung). Drei der vier Mittelwertsunterschiede sind hochsignifkant (a < 0,01), einer aufgrund geringerer Stichprobengröße infolge einer vorhergehenden Filterfrage signifikant (a < 0,05).



    Ohne an dieser Stelle auf mögliche Erklärungen für dieses Phänomen einzugehen: bei der Konzeption einer Befragung muss man sich im klaren sein, dass man mit Incentives nicht nur die Teilnehmerquote erhöht, sondern auch die Ergebnisse (inhaltlich) beeinflusst. Aus der Sicht manches Auftraggebers mag es zwar verlockend sein: gleichzeitig eine höhere Stichprobe und (aus seiner Sicht) "bessere" Ergebnisse zu erhalten, die Validität dieser Resultate ist jedoch höchst fraglich.

    Mit dem Schluss unserer Ausführungen knüpfen wir somit wieder am Beginn an: eingangs haben wir festgestellt, dass die methodologischen Erkenntnisse bezüglich der Online-Umfrageforschung noch sehr lückenhaft sind, insbesondere was größere Zusammenhänge betrifft. Es hat sich gezeigt, dass es zwar möglich ist, mit relativ einfachen Mitteln mehr Teilnehmer zu rekrutieren und die Abbruchrate zu reduzieren. Diese Maßnahme wirkt sich aber auch auf weitere zentrale Bereiche, hier das Antwortverhalten der Befragten, aus.

    Angesichts dieser Effekte wird der Bedarf basaler methodologischer Forschung und Erkenntnisse offensichtlich, um mehr über die zugrunde liegenden Mechanismen zu erfahren.


    Reips, Ulf-Dietrich ; Neuhaus, Christoph Institution: Psychologisches Institut, Universität Zürich
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "WEXTOR: A Web experiment generator. "


    Rodenhausen, Thomas ; Institution: MediaTransfer Netresearch and Consulting AG, Hamburg
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Validity of online obtained self-report data: Social desirability as a means for validation."


    Sander, Carsten ; Institution: Georg-August-Universität Göttingen
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Konsumentenanalyse im Webchat. Versuch einer bedürfnisprofilorientierten Segmentierung."


    Sassenberg, Kai ; Boos, Margarete; Institution: Lehrstuhl Sozialpsychologie, Friedrich-Schiller-Universität Jena
    Article (version: 25/06/2002 - 07:47, size: 16347)
    "Wer wir sind und wie wir sind: Anonymität und explizite Normen als Prädiktoren von sozialem Einfluß in CMC."
    German: In computervermittelter Kommunikation (cvK) verfügen die Kommunikationspartner über weniger personen- und verhaltensbezogene Information voneinander. Diese wechselseitige Anonymität führte Kiesler, Siegel und McGuire (1984) zu der in ihrem Reduced Social Cues (RSC) Ansatz zentralen Annahme, dass Verhaltensweisen, die in computervermittelt kommunizierenden Gruppen auftreten, genauso erklärt werden können wie das Phänomen der Deindividuation. Als Deindividuation bezeichnet man das selbstvergessene Aufgehen in einer großen, anonymen Gruppe, das mit extremem, ungehemmtem Verhalten einhergeht (z.B. in Konflikten bei Demonstrationen). Kiesler et al. (1984) erwarten extremes Verhalten in cvK Gruppen verglichen mit face to face (ftf) kommunizierenden Gruppen und als Kommunikationsergebnis auch extremere Entscheidungen. Diese heute noch weit verbreitete Annahme wird in diesem Beitrag anhand neuerer theoretischer Ansätze und empirischer Befunde in Frage gestellt. Darüber hinaus werden zwei eigene Studien berichtet.

    Effekte von Anonymität in computer-vermittelter Kommunikation

    Nach dem RSC Ansatz (Kiesler et al., 1984) führt cvK neben anderen Konsequenzen vor allem zu einer verglichen mit ftf Kommunikation größeren Anonymität. Es wird vermutet, dass extremes Verhalten bei cvK auf diese relative Anonymität zurückgeführt werden kann. Die theoretische Kernannahme wurde dabei der Deindividuationstheorie von Zimbardo (1969) entliehen: Anonymität führt nach dem RSC Ansatz in großen Gruppen wie in computervermittelt interagierenden Gruppen zu extremem, ungehemmtem Verhalten. Als zentrale vermittelnde kognitive Variable galt dabei die Selbstaufmerksamkeit. Es wurde angenommen, dass in anonymen Gruppen die Selbstaufmerksamkeit zurückgeht und als Konsequenz das Verhalten weniger kontrolliert ausgeführt wird (siehe auch Diener, 1980). Enthemmtes Verhalten sollte sich nach den Annahmen der Autoren im sogenannten flaming (d.h. Beschimpfen der Kommunikationspartner und anderer Personen etc.) und dem Austausch extremer Argumente äußern, die in ftf Interaktionen eher zurückgehalten werden. Auch sollten die Gruppen aufgrund dieser Argumente extremere Entscheidungen treffen.

    Diese Annahmen wurden in den zurückliegenden fast zwei Jahrzehnten cvK Forschung überprüft und stark in Frage gestellt. So fiel die Selbstaufmerksamkeit in cvK keinesfalls geringer, sondern eher größer aus (siehe Sassenberg, Rabung & Boos, 1999 für einen Überblick). Daneben erwies sich flaming als ein seltenes und nicht in jeder anonymen cvK Interaktion auftretendes Verhalten, dass vermutlich von anderen Faktoren wie kontextbedingten Normen abhängig ist (siehe Lea, O’Shea, Fung & Spears, 1992). Schließlich fanden die Mitglieder der Arbeitsgruppe um Kiesler selbst in ihren Untersuchungen keine Unterstützung für die Annahme, dass Entscheidungen in cvK extremer ausfallen als in ftf Diskussionen (z.B. McGuire, Kiesler & Siegel, 1987; Weisband, 1992).

    Aufgrund dieser Befundlage liegt die Frage nahe, welche Annahme des RSC Ansatzes fehlerhaft ist: Wurde die Bedeutung der Anonymität überschätzt? Dies ist vermutlich nicht der Fall. Eine Metaanalyse von Studien zur Deindividuation legt vielmehr nahe, dass die klassischen Deindividuationstheorien generell nicht korrekt sind und dies die Ursache der mangelnden Evidenz für den RSC Ansatz ist (Postmes & Spears, 1998). So wurde zwar im Mittel ein statistisch bedeutsamer, aber extrem geringer (r=.09) und stark streuender Effekt unterschiedlicher Deindividuationsmanipulationen (vor allem Anonymität und Selbstaufmerksamkeit) auf extremes Verhalten gefunden. Die Streuung konnte zum großen Teil durch einen Moderator aufgeklärt werden: die Existenz von situativen Normen im experimentellen Paradigma. Anonymität führte vor allem dann zu extremem Verhalten, wenn dies durch die Gestaltung der Untersuchungssituation nahegelegt wurde. Ein extremes Beispiel stellt eine Untersuchung von Johnson und Downing (1979) dar. Sie fanden unterschiedliche Effekte in Abhängigkeit davon, ob die Untersuchungsteilnehmer/innen in Klu-Klux-Klan Kostümen oder in der Kleidung von Krankenschwestern/-pflegern anonymisiert wurden. In Klu-Klux-Klan Kostümen führte die Anonymität zu aggressivem Verhalten, in Krankenschwester / -pfleger Kleidung zu prosozialerem Verhalten.

    Die Befunde von Johnson und Downing (1979) können genau wie die Befunde der Metaanalyse mit einem neueren theoretischen Ansatz zur Deindividuation erklärt werden: dem Social Identity Model of Deindividuation Effects (SIDE; Reicher, Spears & Postmes, 1995). Das SIDE baut auf der Selbstkategorisierungstheorie (SCT; Turner et al., 1987) auf. Nach der SCT ist das Selbstbild nicht nur durch die Individualität einer Person bestimmt (personale Identität) sondern auch durch die Mitgliedschaft in sozialen Gruppen (soziale Identität). In Abhängigkeit von situativen Gegebenheiten können diese beiden Aspekte unterschiedlich bedeutsam (salient) werden. Die jeweils saliente Identitätskategorie bestimmt auch das Verhalten mit. Bei salienter sozialer Identität orientiert sich das Verhalten an den Normen der jeweiligen Gruppe; ist hingegen die personale Identität salient, wird das Verhalten eher persönlichen Zielen folgen und der Darstellung der Individualität dienen. Nach dem SIDE führt Anonymität zu einer Akzentuierung der jeweils dominierenden Selbstwahrnehmung. Bei salienter personaler Identität verhindert die Anonymität die Wahrnehmung von Gemeinsamkeiten mit anderen Gruppenmitgliedern, so dass die personale Identität nicht zu Gunsten einer sozialen Identität abgeschwächt werden kann. Umgekehrt wird bei salienter sozialer Identität durch die Anonymität eine Wahrnehmung von Unterschieden innerhalb der entsprechenden Gruppe verhindert, die bei nicht-anonymer Kommunikation zu einer Abschwächung der sozialen Identität führen würde. Neben der oben angeführten Metaanalyse liegen zahlreiche Evidenzen für das SIDE vor (zusammenfassend Postmes, Spears, Lea & Reicher, 2000; Sassenberg, 1999). So verglichen Spears, Lea und Lee (1990) zum Beispiel die Einstellungsänderung durch eine cvK Diskussion in 3er Gruppe, deren Mitglieder sich entweder in einem Raum befanden und sich somit sehen konnten oder sich in unterschiedlichen Räumen befanden und deshalb anonym blieben. Als zweite Untersuchungsbedingung wurde eine Salienz der personalen oder der gemeinsamen sozialen Identität hergestellt. Wie nach dem SIDE zu erwarten, orientierten sich die Interagierenden mit salienter sozialer Identität nach anonymer Diskussion eher an der Gruppennorm als bei nicht-anonymer Diskussion. In der Bedingung mit salienter personaler Identität hingegen trat nach anonymer Diskussion eine stärkere, die Individualität unterstreichende Einstellungsänderung weg von der Gruppennorm auf als bei nicht-anonymer Interaktion.

    Es wurde oft argumentiert, dass das SIDE eine Basis für die Erklärung vieler Befunde zum Vergleich zwischen ftf und cvK darstellen könnte (z.B. Postmes, Spears & Lea, 1998, 1999). Die Vorhersagen des SIDE zur Wirkung von Anonymität weisen genau wie der Befund von Spears et al. (1990) Parallelen zu den Forschungsergebnissen zum Vergleich zwischen ftf und cvK auf. So wurde in einigen Studien eine extreme Einstellungsänderung in cvK (verglichen mit ftf) festgestellt (z.B. Kiesler et al., 1984). Dies entspricht den Vorhersagen, dass unter Anonymität bei salienter sozialer Identität mehr Einstellungsänderung auftritt. Die in anderen Studien gefundene vergleichsweise geringere Einstellungsänderung in cvK (z.B. McGuire et al., 1987) entspricht den Vorhersagen des SIDE bei salienter personaler Identität. Es könnte folglich sein, dass durch unterschiedliches Vorgehen in einzelnen Studien einmal die personale und ein anderes Mal die soziale Identität der Interaktionspartner salient wurde. Dies würde die scheinbar widersprüchlichen Befunde aus Studien zum Medienvergleich erklären. Eine direkte Prüfung dieser Annahme wurde in den beiden im folgenden zusammengefassten Studien vorgenommen.

    Anwendbarkeit des Social Identity Model of Deindividuation Effects auf computer-vermittelte Kommunikation

    In zwei Studien haben wir die zwei zentralen Unterschiede zwischen bisherigen Studien zum SIDE und zum RSC Ansatz aufgegriffen und ihre Bedeutung geprüft (Sassenberg & Boos, 2001). Die erste Studie greift das bereits beschriebene zentrale Problem für die Anwendung des SIDE auf den Vergleich zwischen ftf und cvK auf: die Manipulation der Anonymität. In der ersten Studie wurde deshalb die Anonymität durch den Vergleich zwischen ftf und cvK manipuliert. Darüber hinaus erfolgte eine Manipulation der salienten Identität (personal vs. soziale Identität). Es trat zwar die erwartete Anonymität x Identität Interaktion auf. Entgegen der Erwartungen fielen die Einstellungen nach der Diskussion jedoch bei salienter personaler Identität bei cvK extremer aus als bei ftf Kommunikation. In der Bedingung mit salienter sozialer Identität kam es bei ftf zu extremeren Entscheidungen als bei cvK. Der Befund bei salienter personaler Identität ist zwar unerwartet, aber in sofern mit dem SIDE im Einklang, als die inhaltliche Entscheidung nach der cvK Diskussion stärker den individuellen Zielen und Bedürfnissen entsprach als nach der ftf Diskussion: die Teilnehmenden gaben an, eher bereit zu sein, für ihren Lebenspartner Gesetze zu brechen. Geringere Konformität zur Gruppennorm bei salienter sozialer Identität nach cvK als nach ftf Kommunikation steht allerdings in klarem Widerspruch zum SIDE. Ursache für diesen Befund könnte ein Unterschied zwischen der soeben beschriebenen Studie und Studien zum RSC Ansatz auf der einen Seite und Studien zum SIDE auf der anderen Seite sein: In den Studien zum SIDE wurde grundsätzlich eine Gruppennorm vorgegeben, hier und in den Studien zum RSC war dies nicht der Fall (für eine ausführliche Diskussion des Effekts von vorgegebenen Gruppennormen siehe Waldzus & Schubert, 2000).

    Um den Effekt der Vorgabe von Normen zu testen, wurde in einem Experiment neben der Anonymität die Vorgabe einer für die Teilnehmerpopulation vorgetesteten Gruppennorm variiert (mit vorgegebener Norm vs. ohne vorgegebene Norm). In allen Gruppen wurde eine saliente soziale Identität hergestellt, da ein Effekt der Gruppennorm insbesondere bei salienter sozialer Identität zu erwarten ist. Vorhergesagt wurde, dass bei vorgegebener Gruppennorm analog zu den Studien zum SIDE Anonymität die Orientierung an dieser Norm verstärkt. Bei nicht vorgegebener Gruppennorm wurde bei Anonymität eine geringere Orientierung an der Gruppennorm (die dann aus den eigenen Einstellungen der Gruppenmitglieder zu erschließen war, vgl. Turner et al., 1987) erwartet. Die Befunde entsprachen diesen Hypothesen.

    Insgesamt geht aus den berichteten Befunden hervor, dass der Effekt des Kommunikationsmediums auf die Einstellungsänderung und damit vermutlich auch auf andere Verhaltensweisen mit Bezug zu Gruppennormen mit Hilfe des SIDE vorhergesagt werden kann. Allerdings muss eine Einschränkung gemacht werden: Bei salienter personaler Identität kommt es bei cvK (verglichen mit ftf Kommunikation) zu einer Orientierung an eigenen Zielen und Bedürfnissen. Dies kann sich z.B. in einer Einstellungsänderung weg von einer Gruppennorm ausdrücken, mit dem Ziel die eigene Individualität zu betonen. Bei salienter sozialer Identität und eindeutig vorhandener Gruppennorm wird durch Anonymität in cvK eine stärkere Orientierung an den Gruppennormen ausgelöst. Liegt hingegen keine eindeutige Norm vor, ist die Orientierung an der (aus den Mitgliedermeinungen ableitbaren) Gruppennorm in cvK geringer als bei ftf Kommunikation.

    Literatur

    Diener, E. (1980). Deindividuation: The absence of self-awareness and self-regulation in group members. In P. B. Paulus (ed.), The psychology of group influence (pp. 209-242). Hillsdale, NJ: Erlbaum.

    Johnson, R. D. & Downing, L. L. (1979). Deindividuation and valence of cues: Effects on prosocial and antisocial behavior. Journal of Personality and Social Psychology, 37, 1532-1538.

    Kiesler, S., Siegel, J. & McGuire, T. W. (1984). Social psychological aspects of computer-mediated communication. American Psychologist, 39, 1123-1134.

    Lea, M., O'Shea, T., Fung, P. & Spears, R. (1992). 'Flaming' in computer-mediated communication. Observations, explanations, implications. In M. Lea (ed.), Contexts of computer-mediated communication (pp. 89-112). New York: Harvester Wheatsheaf.

    McGuire, T. W., Kiesler, S. & Siegel, J. (1987). Group and computer-mediated discussion effects in risk decision making. Journal of personality and social psychology, 52, 917-930.

    Postmes, T. & Spears, R. (1998). Deindividuation and anti-normative behavior: A meta-analysis. Psychological Bulletin, 123, 238-259.

    Postmes, T., Spears, R. & Lea, M. (1998). Breaching or building social boundaries? SIDE-Effects of computer-mediated communication. Communication Research, 25, 689-715.

    Postmes, T., Spears, R., & Lea, M. (1999). Social identity, group norms, and "deindividuation": Lessons from computer-mediated communication for social influence in the group. In N. Ellemers, R. Spears, & B. Doosje (eds.), Social identity: Context, commitment, content. Oxford: Blackwell.

    Postmes, T., Spears, R., Lea, M. & Reicher, S. (eds.) (2000). SIDE issues centre stage: Recent developments of de-individuation in groups. Amsterdam: KNAW.

    Reicher, S. D., Spears, R. & Postmes, T. (1995). A social identity model of deindividuation phenomena. European Review of Social Psychology, 6, 161-198.

    Sassenberg, K. (1999). Sehen und gesehen werden. Normorientierung unter Anonymität. Lengerich: Pabst.

    Sassenberg, K. & Boos, M. (2001). Attitude change in computer-mediated communication: Effects of anonymity and norms. Manuscript submitted for publication.

    Sassenberg, K., Rabung, S. & Boos, M. (1999). Selbstaufmerksamkeit in computervermittelter Kommunikation. In U.-D. Reips, B. Batinic, W. Bandilla, M. Bosnjak, L. Gräf, K. Moser, & A. Werner (Eds./Hrsg.), Current internet science - trends, techniques, results. Aktuelle Online Forschung - Trends, Techniken, Ergebnisse. Zürich: Online Press. [WWW document]. Available URL: http://dgof.de/tband99/.

    Spears, R., Lea, M. & Lee, S. (1990). De-individuation and group polarisation in computer-mediated communication. British Journal of Social Psychology, 29, 121-134.

    Turner, J. C., Hogg, M. A., Oakes, P. J., Reicher, S. D. & Wetherell, M. S. (eds.). (1987). Rediscovering the social group. A self-categorization theory. New York, NY: Blackwell.

    Waldzus, S. & Schubert, T. (2000). Group norm and category norm in anonymous situations: Two sources of social influence. In T. Postmes, R. Spears, M. Lea, & S. Reicher (eds.). SIDE issues centre stage: Recent developments of de-individuation in groups (pp. 31-46). Amsterdam: KNAW.

    Weisband, S. P. (1992). Group decision and first advocacy effects in computer-mediated and face-to-face decision making groups. Organizational Behavior and Human Decision Processes, 53, 352-380.

    Zimbardo, P. G. (1969). The human choice: Individuation, reason, and order vs. deindividuation, impulse, and chaos. In W. J. Arnold & D. Levine (eds.), Nebraska symposium on motivation (pp. 237-307). Lincoln: Univ. of Nebraska Press.


    Sassenberg, Kai ; Institution: Lehrstuhl Sozialpsychologie, Friedrich-Schiller-Universität Jena
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Grundlagen @ Internet"


    Schütze, Stephan ; Fritsche, Immo Institution: {}
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "„Wir haben die Lokomotive!“ – Psychologische Forschung im Huckepack des Online-Entertainment."


    Schweiger, Wolfgang ; Institution: IPMZ – Institut für Publizistikwissenschaft und Medienforschung der Universität Zürich
    Article (version: 25/06/2002 - 07:47, size: 165)
    "Navigations- und Lerneffekte der Linkgestaltung im Web. "
    German: Präsentation im PDF-Format (ca. 2,3 MB)

    Präsentation als Powerpoint-Datei (ca. 800 kB)


    Siepmann, Rolf ; Oppermann, Daniela Institution: Institut für Phonetik und Sprachliche Kommunikation, Ludwig-Maximilians-Universität München
    Article (version: 25/06/2002 - 07:47, size: 14602)
    "Ein Online-Dialogexperiment mit Kontrastakzenten im Deutschen."
    German:

    1. Einleitung

    Die rapide Entwicklung des Internets ist ein viel diskutiertes Phänomen. Der Bundesverband der Informationswirtschaft, Telekommunikation und neue Medien geht davon aus, dass gegen Ende des Jahres 2003 in etwa jeder zweite Deutsche das Internet per PC nutzt [1]. Die damit prognostizierte Zahl von ca. 40 Millionen Nutzern des Internets erhöht sich deutlich, wenn die zukünftige Anzahl der mobilen Internetzugänge in Deutschland hinzugezogen wird. Infolge wachsender Übertragungsraten ist zudem die - weitestgehend - problemlose Einbindung von speicherintensiven Dateien mit etwa Sprach- oder Grafikdaten in den elektronischen Kommunikationsprozess absehbar. In der deutschen Medienlandschaft ist dem Internet vornehmlich aus diesen Gründen zukünftig eine zentrale Rolle zuzuweisen1.

    Die phonetische Forschung kann infolge dieser Entwicklung effizient verschiedene, umfangreiche Sprechergruppen mit dem Ziel erreichen, empirisch valide Daten über das gesprochene Deutsch bzw. über dessen verschiedene Ausprägungen zu erheben. Eine übliche Klassifikation von Sprechern ist ihre regionale, dialektale und/oder soziolektale Zuordnung, wobei ein Sprecher grundsätzlich mehrfach zu klassifizieren ist. Vergleichbar mit den traditionellen Telefonbefragungen können repräsentative Erhebungen im Internet auf gezielten Anschreiben von bestimmten Sprechergruppen und/oder auf gezielten Werbeaktionen beruhen.

    Ein eingängiges Beispiel für die Schwierigkeit, phonetisch repräsentative Daten zu gewinnen, bilden Untersuchungen zum Standarddeutschen. Das Standarddeutsche ist dem Aussprachewörterbuch des Duden folgend eine einheitliche überregionale Gebrauchsnorm, die der Sprechwirklichkeit nur approximativ entspricht [3]. Eine entsprechende phonetische Untersuchung muss demnach zum einen unter dem Aspekt der Bevölkerungsstatistik repräsentative Probanden ermitteln, die diese Gebrauchsnorm in ihrem sprachlichen Verhalten beherrschen (können). Die Bestimmung von gesprochenem Standarddeutsch ist allerdings eine gleichermaßen empirische Frage, so dass an dieser Stelle zum anderen ebenfalls bevölkerungsstatistisch repräsentative Sprecherurteile erhoben werden müssen.

    Die Erhebung von empirisch-phonetischen Daten im Internet besteht einerseits aus der explorativen Datensammlung beispielsweise in Form von Fragebogen, die in der Regel auf entsprechend präsentierten akustischen Sprachproben aufbauen. Andererseits sind im Internet auch kontrollierte Experimente zur gezielten Überprüfung von phonetischen Hypothesen durchführbar. Dieser Beitrag stellt in Abschnitt 3 ein phonetisches Online-Dialogexperiment vor, das die Qualität eines Verfahrens zur Modellierung von Kontrastakzenten im Deutschen untersucht. Der theoretische Hintergrund des Experiments ist Gegenstand des folgenden Abschnitts.



    1. Modellierung von Kontrastakzenten

    Kontrastakzente (im Deutschen) sind formal gesehen lautliche Hervorhebungen von syntaktischen Einheiten eines geäußerten Satzes. Die lautlichen Hervorhebungen bestehen einer üblichen Auffassung folgend primär aus Veränderungen des Tonhöhenverlaufs des geäußerten Satzes, der akustisch mit dem Verlauf der Grundfrequenz (F0) korreliert. Eine in der alltäglichen Kommunikation häufig anzutreffende Funktion von Kontrastakzenten ist ihr Beitrag zu einer Satzbedeutung, in der eine lexikalische Gegenüberstellung der akzentuierten syntaktischen Einheit mit einer vergleichbaren syntaktischen Einheit aus dem Diskurskontext des entsprechenden Satzes zum Ausdruck gebracht wird [4]. In minimalen Dialogen zwischen zwei Sprechern A und B läßt sich diese Funktion von Kontrastakzenten leicht demonstrieren [5]:


    A. Klaus bucht heute eine Reise.

    B. MONA bucht heute eine Reise.

    Die Korrelation von wahrgenommenen Tonhöhenveränderungen und gemessenen F0-Verläufen in sprachlichen Äußerungen ist in der Phonetik im einzelnen umstritten. Das in Abschnitt 3 beschriebene Online-Dialogexperiment untersucht das neue automatische Verfahren MOMEL ('modelling melody'), welches bestimmte Zielpunkte in F0-Verläufen berechnet [6]. Die Zielpunkte bilden Korrelate von tonalen Wendepunkten, die in der dem Verfahren zugrundeliegenden Theorie konstitutiv für die Wahrnehmung des Tonhöhenverlaufs einer sprachlichen Äußerung sind. MOMEL ist in ein Softwaresystem integriert, das die visuelle und über eine Resynthese auditive Überprüfung der modellierten F0-Verläufe ermöglicht [7]. Damit können auch synthetische Sprachstimuli erzeugt werden, die einen mit dem MOMEL-Verfahren modellierten F0-Verlauf aufweisen.

    Die einzelnen Schritte des MOMEL-Verfahrens werden an dieser Stelle nicht behandelt; in dem vorliegenden Zusammenhang interessiert vielmehr die experimentelle Verwendung der resynthetisierten Sprachstimuli mit dem modellierten F0-Verlauf. Die resynthetisierten Sprachstimuli werden in dem im folgenden beschriebenen Online-Dialogexperiment mit dem Ziel verwendet, die Rolle der mit MOMEL berechneten F0-Zielpunkte bei der Manifestation von Kontrastakzenten im Deutschen zu untersuchen.


    1. Online–Dialogexperiment

    Das Dialogexperiment verwendet ein akustisches Korpus mit 15 Dialogen zwischen zwei Personen A und B, in denen B in einem geäußerten Satz stets zwei Kontrastakzente realisiert. Die B-Sätze wurden dabei jeweils von zwei Sprechern S1 und S2 realisiert; der folgende Dialog ist ein Beispiel des Korpus2:


    A. Klaus bucht in den nächsten beiden Tagen eine Reise, und Mona auch. Ich glaube, Klaus bucht morgen eine Reise.

    B. MONA bucht HEUTE eine Reise.


    Von den A-B-Dialogen wurde von Sprecher A jeweils nur der letzte Teil seiner Äußerung verwendet (z.B.: Klaus bucht morgen eine Reise). Die F0-Verläufe der Äußerungen der Sprecher S1 und S2 wurden mit dem oben genannten MOMEL-Verfahren modelliert. Die damit entstandenen neuen zwei mal 15 Dialoge A'-B' wurden in verschiedenen Experimentdurchläufen auf einer WWW-Seite einschließlich dreier Kontrolldialoge präsentiert. Die Kontrolldialoge sind Kombinationen von A'-B'-Dialogen, in denen der B'-Satz keine entsprechenden Kontrastakzente enthält.

    Die Probanden hatten die Aufgabe, die Satzpaare A'-B' im Sinne eines natürlichen Dialogs als gut, einigermaßen oder schlecht zusammen passend zu beurteilen. Zusätzlich gab es die Option „keine Bewertung”, wenn ein Proband einen Dialog nicht beurteilen konnte. In dem Fall einer Beurteilung als gut oder einigermaßen passend wurde die MOMEL-Zielpunkte des F0-Verlaufs als relevante Parameter des entsprechend modellierten F0-Verlaufs angesehen. Ein CGI-Script protokollierte die aufgerufenen Sounddateien, so dass ungültige Experimentdurchläufe im Fall von nicht (vollständig) angehörten, aber beurteilten Dialogen ausgemustert werden konnten. Um eine möglichst breite Streuung der Probanden zu erreichen, wurde für das Online-Dialogexperiment mit einem Anschreiben per email an verschiedene im Internet vertretene Institutionen wie etwa Universitätsinstituten, Schulen oder Heimatvereinen geworben (Auswahl aufs Gradewohl). Zudem wurde das Experiment bei verschiedenen Suchmaschinen im Internet angemeldet. Die Probanden erhielten für ihre Teilnahme eine Telefonkarte im Wert von 6 DM.

    An dem Online-Dialogexperiment nahmen insgesamt 48 Probanden teil, die das Experiment vollständig durchführten. Tabelle 1 gibt die regionale Verteilung der Probanden wieder [9]3, die auf der Auswertung eines Formulars beruht, welches die 48 Probanden vor dem Beginn des Experiments ausfüllten (17 Männer, 31 Frauen)4; s.a. Abbildung 1.Von den Probanden beurteilten 16 die Varianten von Sprecher S1, und 32 Probanden beurteilten die entsprechenden Varianten des Sprechers S2. Insgesamt wurden somit 864 Beurteilungen getroffen, von denen 20 aus „keine Bewertung” bestanden. Die verbleibenen 844 Beurteilungen beinhalten 134 Beurteilungen von Kontrolldialogen, von denen 11% als gut, 32% als einigermaßen und 55% schlecht beurteilt wurden. Von den 710 Beurteilungen der passenden Dialoge wurden 49% als gut, 29% als einigermaßen und 29% als schlecht beurteilt.



    Abbildung 1




    1. Diskussion

    Die vorwiegend positive Beurteilung der mit dem MOMEL-Verfahren modellierten Kontrastakzente weist auf die perzeptiv und auch funktional adäquate Modellierung der entsprechenden F0-Verläufe hin. Die F0-Zielpunkte des Verfahrens bilden damit relevante akustische Korrelate von Kontrastakzenten im Deutschen. Die regionale Verteilung der Probanden des Online-Dialogexperiments belegt darüber hinaus die Möglichkeiten des Internets, unterschiedliche Sprechergruppen zu erreichen.

    Eine Auswertung der LOG-Files des CGI-Scripts des Experiments ergab schließlich, dass sehr wenig Experimentabbrüche auftraten. Somit haben die meisten Internetnutzer, die das Experiment angefangen haben, den Durchlauf auch freiwillig beendet. Dieser Umstand ist als Vorteil gegenüber den traditionellen Laborexperimenten zu werten, in denen Probanden die Situation nicht ohne weiteres beenden können. Es ist mit anderen Worten davon auszugehen, dass die in dem Online-Dialogexperiment gesammelten Sprecherurteile eine hohe Validität aufweisen, weil die Probanden das Experiment nicht entgegen ihrer Motivation zu Ende geführt haben.

    Das letztgenannte Ergebnis entspricht Erfahrungen mit anderen psychologischen und soziologischen Online-Experimenten, in denen durch die Laborsituation entstehende Artefakte wie etwa der individuelle Einfluss des Experimentators auf den Experimentverlauf überwunden werden konnten [10]. Die im Internet im Vergleich zur Laborsituation bestehende größere Anonymität der Probanden und auch der Experimentatoren kann demnach ein authentischeres Verhalten der Probanden fördern, so dass valide Daten im Internet erhoben werden können.



    1. Literatur

    [1] Bundesverband Informationswirtschaft, Telekommunikation und neue Medien e.V. (BITKOM), Wege in die Informationsgesellschaft. Status quo und Perspektiven Deutschlands im internationalen Vergleich. Edition 2001.

    [2] ARD/ ZDF-Offline-Studie, Nichtnutzer von Online: Zugangsbarrieren bleiben bestehen. Media Perspektiven 8/ 2000.

    [3] Duden Aussprachewörterbuch (= Der Duden, Band 6). Mannheim: Dudenverlag, 1990.

    [4] Lieb, H.-H. (1999), Was ist Wortakzent? Eine Untersuchung am Beispiel des Deutschen. In: Schindler, W./ Untermann, J. (Hrsg.), Grippe, Kamm und Eulenspiegel. Festschrift für Elmar Seebold zum 65. Geburtstag. Berlin: de Gruyter, 225-261.

    [5] Lieb, H.-H. (1983), Akzent und Negation im Deutschen – Umrisse einer einheitlichen Konzeption. Teil A. Linguistische Berichte 84, 1-32.

    [6] Hirst, D./ Di Christo, A./ Espesser, R. (2001), Levels of representation and levels of analysis for the description of intonation systems. In: Horne, M. (ed), Prosody: Theory and Experiment. Kluwer Academic Press. [hier Manuskript von D. Hirst verwendet].

    [7] Mes Signaix package, s.u. http://www.lpl.univ-aix.fr/ext/projects/mes_signaix.htm/

    [8] Siepmann, R. (2001), Phonetische Intonationsmodelle und die Parametrisierung von kontrastiven Satzakzenten im Deutschen. Dissertation, LMU München.

    [9] Burger, S./ Schiel, F. (1995), RVG 1 – A Database for Regional Variants of Contemporary German. Proceedings of LREC, Granada 1995.

    [10] Hewson, C. M./ Laurent, D./ Vogel, C. M. (1996), Proper Methodologies for Psychological and Sociological Studies Conducted via the Internet. Behavior Research Methods, Instruments, and Computers 28(2), 186-191.


    1) Diese Einschätzung teilen im übrigen auch Personen, die das Internet nicht nutzen [2].

    2) Die genaue Konstruktion des insgesamt 72 Dialoge umfassenden Korpus einschließlich der experimentellen Validierung der in den B-Sätzen realisierten Kontrastakzente beschreibt [8].

    3) Ort, in dem der Proband am längsten gelebt hat.

    4) Einige Hinweise auf die Population der Internetnutzer finden sich unter http://www.w3b.de/.


    Silberer, Günter ; Institution: Georg-August-Universität Göttingen
    Article preliminary article (version: 25/06/2002 - 07:47, size: 20248)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Forschungsthema eCommerce."


    Stieger, Stefan ; Voracek, Martin Institution: Institut für Psychologie, Universität Wien
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Exploring sexual behavior online: Male-female differences in gender switching and attrition rate. "


    Stockmann, Ralf ; Institution: Zentrum für interdisziplinäre Medienwissenschaft, Georg-August-Universität Göttingen
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Die virtuelle Hochschule – an der Klientel vorbei? Ein studierendebezogener Ansatz am Beispiel von Stud.IP."


    Stöber, Joachim ; Reips, Ulf-Dietrich ; Kaufmann, Esther ; Hahn, André ; Institution: Institut für Psychologie, Martin-Luther-Universität Halle-Wittenberg
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Social desirability in online studies: Personal and motivational factors."


    Temme, André ; Institution: Institut für Psychologie, Universität zu Köln
    Article (version: 25/06/2002 - 07:47, size: 1419)
    "„Quasimeto“: Entwicklung eines Instruments zur Transformation synchroner Datenerhebungsmethoden der Qualitativen Sozialforschung wie Interview oder Gruppendiskussion auf das Medium Internet."
    German: Quasimeto: A tool for performing interviews and online-focus-groups

    This contribution is about the tool "Quasimeto", which was designed for the diploma within the study of psychology. It deals with performing psychological interviews one-to-one or one-to-many or group-discussions (online-focus-groups) over the internet. Gathering data in a synchronous way is as possible as getting quantitative results or automatic transcriptions.

    The tools' genesis is shown within the theoretical background of qualitative research and online research. On the one hand the development itself was done as known from "Early Rapid Prototyping", on the other hand the utilization of methodological principles of qualitative research and the combination of theory, interviews with experts and field work is shown.

    Furthermore the tool itself is shown. It differs in three modules. The modul of administration allows the handling of parameters, which have influence for look and functionality of the interview-modul. The third modul, dealing with the results, allows first quantitative analysis and offers export-formats for further statistical or qualitative reflection.

    A first small evaluation was done with a self-developed kind of usability-questionnaire, therefor three interviewers have been trained with Quasimeto. The results, attesting good quality of the designed tool, are mentioned as well.


    Theobald, Axel ; Institution: Rogator AG, Nürnberg
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Sprachunterstützung bei WWW-Befragungen: Ergebnisse eines Methodenexperimentes."


    Trepte, Sabine ; Institution: Institut für Journalistik und Kommunikationsforschung, Hochschule für Musik und Theater Hannover
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Konvergenz als Erfolgsrezept – Die Verknüpfung von Internet und TV-Inhalten aus Sicht von Machern und Usern."


    Tzanetakis, Robert ; Institution: Universität Wien
    Article (version: 25/06/2002 - 07:47, size: 18999)
    "Ausprägung des Flow-Erlebnis beim Internetsurfverhalten in Abhängigkeit von persönlichen und situativen Faktoren."
    German: Problemstellung und Ziel der Arbeit

    Jene Studie befasst sich mit der Implementierung und Validierung von "Flow" in mehreren Applikationen des Internet. Inwiefern ist es dem User möglich "Flow" zu erleben und wovon hängt dies ab? Der von Csikszentmihalyi geprägte Begriff des "Flow-Erlebnisses" - also im Fluss sein, Begeisterung, Erfüllung, freudiges Aufgehen in einer Handlung - ist seit den 70er Jahren zentraler Begriff der intrinsischen Motivationsforschung und wurde seitdem in einer Vielzahl von Populationen, Situationen und Kontexten untersucht (Übersicht zu finden in Csikszentmihalyi, 1988, 1991, 2000). In meiner von Univ.Prof. Dr. Peter Vitouch - Medienpsychologe der Universität Wien und Leiter des Ludwig-Bolzmann-Institut für empirische Medienforschung - betreuten Diplomarbeit untersuchte ich eine Stichprobe von n = 71 mit dem Flow-Fragebogen (einer Adaption von Csikszentmihalyis Experience Sampling Method) zu vier Meßzeitpunkten. Im Anschluss wurde eine Testbatterie zur Erfassung von Persönlichkeitsmerkmalen (wie Kontrollüberzeugung, Kohärenzgefühl, Spielerische Grundhaltung) und Surfverhalten (Interneterfahrung, Internetsucht) vorgelegt. Dabei wurde einerseits versucht, das Flow-Konstrukt (erstmals) im "virtuellen Raum" zu validieren, also auf seine Gültigkeit zu überprüfen. Es spielen sämtliche Dimensionen von Flow eine entscheidende Rolle: "positiver Affekt", "Balance zwischen Aufgabenschwierigkeit und Fertigkeiten", "Gefühl der Kontrolle", "involviert sein", "Konzentration", "Zeitverzerrung", "Erwartung" und "Zielorientierung".

    Andererseits wurde Flow mit sämtlichen persönlichen und situativen Variablen in Beziehung gesetzt. Ziel dieser Arbeit war es zu überprüfen, ob der/die Internetsurfer(in) tatsächlich unter bestimmten Umständen leichter in den Zustand des Flow kommt. Und zwar abhängig von eben seiner/ihrer Persönlichkeit (z.B. interne vs. externe Kontrollüberzeugung) und gewissen äußeren Gegebenheiten (z.B. ob die Person zuhause oder in einem Computerhörsaal surft, Webpagegestaltung, Verweildauer auf der Website, Tätigkeit im Netz).

    Methode

    In Anlehnung an Csikszentmihalyi's Experiencing Sampling Method (ESM), in der der Entdecker des Flow-Konstruktes bei Untersuchungen Teilnehmer veranlaßte, mittels eines Signals eines Piepsers, den diese bei sich tragen, mehrmals am Tag einen zweiseitigen Flow-Fragebogen auszufüllen, um auf diese Weise Tätigkeiten, Aktivitäten und damit einhergehend Stimmungswechsel zu rekonstruieren, bat ich meine Teilnehmer in der Versuchsgruppe (VG; n = 27) innerhalb einer Internetsession (Dauer: 2,5-3 Stunden) viermal einen Flow-Fragebogen auszufüllen. Der als "Beurteilungsfragebogen" (es ginge lt. Instruktion um die Beurteilung der Website) vorgegebene Bogen wurde von den Teilnehmern während des Internetsurfens ausgefüllt, sobald diese vom Versuchsleiter mittels Mobiltelefon "angeläutet" würden. Leider gelang es mir (aufgrund der schlechten Zumutbarkeit dieser Vorgehensweise) nur 9 von 27 Vpn in der VG dazu zu veranlassen. Diese Durchführung hat den Vorteil, daß Vpn nicht wissen, wann sie exakt "angeläutet" werden und (wie in Csikszentmihalyi's Studien) sich nicht einer bestimmten Tätigkeit (Website) hinwenden, um diese im Anschluß zu beurteilen. Die übrigen 19 Vpn wurden gebeten "einen Wecker zu stellen" um so alle 35-40 Minuten einen "Beurteilungsbogen" auszufüllen.

    Nach der Internetsession (2.5-3 h) wurden die "Restbögen"(20 min) ausgefüllt. Diese wurden sowohl von Versuchs- und Kontrollgruppe ausgefüllt.

    Die Kontrollgruppe (n = 44) wurde in den Computerräumen des Neuen Institutsgebäudes rekrutiert. (Bedingung: Wahlfreiheit eingeschränkt). Wie schon erwähnt, führte die Versuchsgruppe die Untersuchung am Internetanschluß zu Hause durch. (Bedingung: Wahlfreiheit gegeben, Zwangsminimierung). Der "Restbogen" im Anschluß bestand aus folgender Fragebogenbatterie:

    - Skala des Fragebogens zur Kompetenz- und Kontrollüberzeugung
    - Skala "Spielerische Grundhaltung" aus dem PRF (Personality Research Form)
    - Sample-Items aus dem Fragebogen zum Kohärenzgefühl (Sense of Coherence; Antonovsky, 1987)
    - Skala zur Internetdependenz (abgeleitet aus DSM-IV Manual)
    - Fragen zur Internetnutzung /-erfahrung
    - Angaben zur Person / Statistische Daten

    Hypothesen und Ergebnisse (Auszug)

    Hypothese 1: Es gibt eine hohe Konsistenz zwischen allen Faktoren von Flow. Diese Hypothese konnte bestätigt werden. Die Reliabilitätsanalyse ergab eine annehmbare interne Konsistenz der meisten Faktoren. Einzig die Faktoren "Balance" und "Selbstaufmerksamkeit" scheinen aus der Reihe zu tanzen, da sie eine negative Faktorinterkorrelation aufweisen. Dies könnte an schlecht formulierten oder einer zu geringen Anzahl der Items dieser beiden Konstrukte liegen. Um die interen Konsistenz zu erhöhen wurde der Faktor "Selbstaufmerksamkeit" nicht bei der Durchschnittsberechnung für den Flowwert berücksichtigt. Dies ergibt einen durchaus zumutbaren Reliabilitätskoeffizienten von ALPHA = .6386. Aus theoriegeleiteten Gründen wurde "Balance" bei der Berechnung mitberücksichtigt. Flow besteht somit aus den sieben Faktoren autotelische Erfahrung, Balance, Zielorientierung, Konzentration, Kontrolle, Involvement und Erwartung.

    Um die Aussagekraft und Validität von Flow zu erhöhen und um Vergleiche zu ermöglichen, wurde bei der Überprüfung mancher Hypothsen das "korrigierte Flow" - ohne Berücksichtigung von Balance - hinzugezogen. Das "korrigiert Flow" wartet mit einem Reliabilitätskoeffizienten von ALPHA = .8060 auf. Alle Berechnungen zur interen Konsistenz wurden an der Stichprobe aller Flowfragebögen (n = 280) durchgeführt.

    Hypothese 2a: Der Faktor "autotelische Erfahrung" korreliert mit allen anderen Faktoren von Flow positiv. Diese Hypothese konnte bestätigt werden. Die hohe Korrelation mit dem Mittelwert der übrigen Faktoren unterstützt die Hypothese der internen Konsistenz. Dies ist besonders wichtig, da autotelische Erfahrung als affektive Komponente von Flow einen entscheidenden Faktor darstellt. Dies wurde zusätzlich durch den Vergleich von Extremgruppen überprüft. Hypothese H2b: Menschen, die wenig Flow erleben unterscheiden sich von solchen, die viel Flow erleben, hinsichtlich des Faktors "autotelische Erfahrung" signifikant. Dies wurde durch den Vergleich mittels t-Test für unbhängige Stichproben eindrucksvoll bestätigt.

    Hypothese H4: Personen die am Versuch von zu Hause aus teilnehmen, erleben Flow stärker als solche im Computerhörsaal, d.h. es gibt einen positiven Zusammenhang zwischen der Versuchsbedingung Wahlfreiheit und Flow. Dieser Sachverhalt, als Haupthypothese meiner Diplomarbeit deklariert, konnte bestätigt werde. Zudem wurde zur Überprüfung dieser Hypothese erstmals sowohl die Berechnung mit dem "normalen Flow" als auch dem (viel konsistenteren) "korrigierten Flow" vorgenommen. Die Überprüfung mit dem t-Test für unabhängige Stichproben zeigte, dass die Gruppe "von zuhause" (Wahlfreiheit gegeben) signifikant stärker (p = .058) Flow erlebt als die Gruppe "von Uni" (Wahlfreiheit eingeschränkt). Das Signifikanzniveau erhöht sich (p = .043) als beim t-Test mit dem Wert des "korrigierten Flow" gerechnet wurde. Der Vergleich mit den Extremgruppen "wenig Flow" und "viel Flow" (CHI-Quadrat Test) konnte diese Ergebnisse bestätigen. Vorhandene Wahlfreiheit bzw. verminderte soziale Kontrolle beeinflußt die Ausprägung von Flow signifikant. Personen die zu Hause im Internet surfen, erleben Flow stärker als solche im Computerhörsaal.

    Hypothese H5: Es besteht ein Zusammenhang zwischen der Art der Tätigkeit im Internet und der Ausprägung von Flow. Diese Hypothese konnte nicht bestätigt werden. Es gibt keinen signifikanten Unterschied von Flow in Abhängigkeit der Tätigkeiten News lesen, Informationen (Freizeit) beschaffen, Informationen (Studium/Beruf) beschaffen, Spiele, emailen, chatten und Bilder ansehen. Lediglich nach der Berechnung mit dem "korrigierten Flow" zeigte sich, dass kommunikative Tätigkeiten (Email, chatten,...) tendenziell Flow eher fördern als reine Informationsbeschaffung im Internet. Es besteht jedoch kein signifikanter Zusammenhang zwischen der Art der Tätigkeit im Internet und der Ausprägung von Flow.

    Das Ausmaß an Flow ist annähernd bei jeder Tätigkeit gleich, ein Sachverhalt der mit Ergebnissen zu bisherigen Untersuchung zum Flowerlebnis je nach Tätigkeit "in der realen Welt", übereinstimmt. In der Mehrzahl der Studien zu diesem Thema konnte kein signifikanter Unterschied von Flow bei gewissen Tätigkeiten festgestellt werden, es konnte jedoch sehr wohl gezeigt werden, dass "nichtstun" oder "fernsehen" mit sehr geringen Werten von Flow korrelieren. Andere Studien machen wiederum deutlich, dass es gewisse Tätigkeiten gibt, nämlich solche die uns alles an Konzentration abverlangen, wie z.B. Berg steigen, Schach spielen oder Wellen reiten, die flowförderlich wirken.

    Hypothese H9a: Es gibt eine Korrelation zwischen der Ausprägung von Flow und den Maßen zur Kontrollüberzeugung einer Person. Diese Hypothese konnte bestätigt werden. Die Korrelationsmatrix bestätigt einen signifikant positiven Zusammenhang der Skala SKI des Fragebogens zur Kompetenz- und Kontrollüberzeugung (FKK) mit Flow, sowie einen signifikanten Zusammenhang zwischen dem Gesamtwert des FKK und Flow. Die Skala PC des FKK korreliert nicht mit dem Maß für Flow. Es zeigt sich ein Zusammenhang von Flow mit sämtlichen Maßen zur Kompetenz- und Kontrollüberzeugung, doch ist hier noch nicht klar in welche Richtung dieser verlauft (d.h. ob Flow interne Kontrollüberzeugung beeinflußt oder umgekehrt) bzw. ob es eine dritte Variable gibt, die diese beeinflussen. Das Ergebnis wurde bestätigt durch die Prüfung von Hypothese H9b: Menschen, die wenig Flow erleben unterscheiden sich von solchen, die viel Flow erleben hinsichtlich der Maße zur Kontrollüberzeugung. Dies bedeutet, dass Personen mit höherem Flowwert eine signifikant höhere interne Kontrollüberzeugung sowie einen höheren Gesamtwert der Kompetenz- und Kontrollüberzeugung haben (und umgekehrt), als solche mit niedrigerem Flowwert. Persönlichkeitsmerkmale, die die Erfahrung von Flow begünstigen wären demnach hohes Selbstbewußtsein, Sicherheit in Handlungsplanung und -realisation, Ideenreichtum in neuen Situationen, relative Unabhängigkeit von Zufallseinflüssen, geringe Fremdbestimmung, hohe Autonomie und Handlungsorientierung, alles Merkmale einer hohen Selbstwirksamkeit (FKK-SKI).

    Hypothese H12a: Es gibt eine Korrelation zwischen der Ausprägung von Flow, Interneterfahrung und Internetsucht. Diese Hypothese konnte nicht bestätigt werden. Hypothese H12b: Menschen, die wenig Flow beim Surfen erleben unterscheiden sich von solchen, die viel Flow erleben hinsichtlich der Interneterfahrung und hinsichtlich der Internetsucht. Auch der Extremgruppenvergleich mittels t-Test konnte keinerlei Zusammenhänge bestätigen. Somit ist Flow beim Internetsurfen weder von der Interneterfahrung der Person abhängig, noch hängt es mit den angegebenen Werten zur Internetsucht irgendwie zusammen. Das Ergebnis entspricht nicht meinen Erwartungen, da ein flowoptimistischer Ansatz durch eine negative Korrelation von Flow und Internetsucht keinerlei (inhaltlichen) Zusammenhang zwischen Flow und Sucht (nach einer Tätigkeit) beweisen würde, ein flowpessimistscher Ansatz hingegen durch eine positive Korrelation zwischen Flow und (Internet-)Sucht den Zusammenhang zwischen diesen beiden Konstrukten bestätigen würde. Ein Grund für das nicht erwartete Ergebnis könnte die mangelnde Validität des selbst konstruierten, jedoch nicht normierten Testinstruments sein. Die Skala zur Internetsucht wurde aus den Kriterien zur Spielsucht des DSM IV abgeleitet und ist anderen, in internationalen Studien verwendeten Internetdependenzskalen (Hahn & Jerusalem, 2000) sehr ähnlich.

    Interpretation und Diskussion

    Allgemein gesehen entsprechen die meisten Ergebnisse durchaus den Erwartungen. So konnte in dieser Untersuchung die innere Konsistenz von Flow (unter Ausschluß von zwei Faktoren) bestätigt werden. Das "korrigierte Flow" besteht somit aus den sechs Faktoren autotelische Erfahrung (positiver Affekt), Zielorientierung, Konzentration, Kontrolle, Involvement und Erwartung, die zueinander hoch konsistent sind. Somit können diese zu "Flow" zusammengefaßt werden. Die Validität des Konstrukts innerhalb eines gewissen Settings (hier: Internet) ist wiederum Voraussetzung um mit diesem Berechnungen durchführen zu können.

    In der Überprüfung des Einflusses von situativen Variablen konnten der Großteil der Erwartungen bestätigt werden. Wie im "realen Leben", zeigt sich auch im virtuellen Raum, dass eine längere Beschäftigung mit einer Tätigkeit, sowie eine subjektiv gute Struktur der Aufgabe/des Umfeldes, der Wahrscheinlichkeit des Eintretens und des Ausmaßes der Intensität von Flow förderlich sind. Eine weitgehende Unabhängigkeit von der Tätigkeit (es reicht, wenn etwas aktiv "getan" wird) des Flow-Erlebnisses bestätigt sich auch im Intenet. Ich vermute, dass generell Internetsurfen, als interaktive Tätigkeit, Flow eher zuläßt, im Gegensatz zu passiven Tätigkeiten, wie fernsehen etc. Doch dies zu bestätigen bedarf eigener Untersuchungen, und bleibt vorerst reine Spekulation.

    Ebenso konnte in der Studie die Haupthypothese bestätigt werden, nämlich eine kausale Abhängigkeit des Flow vom Ausmaß an Wahlfreiheit. Es zeigte sich, das die Gruppe mit viel Wahlfreiheit / wenig soziale Kontrolle (Surfen zuhause) weit höhere Werte von Flow erreichte, als die Gruppe mit wenig Wahlfreiheit/ großer sozialen Kontrolle (Surfen im überfülltem Computerhörsaal). Das Ergebnis deckt sich mit dem einer Untersuchung mit Musikern (Schubert, 1997), die in der Kontrollbedingung in Anwesenheit und auf Kommando des Versuchsleiters musizierten und in der Versuchsbedingung allein bei sich zuhause musizierten, wobei das Stück auf Tonband aufgenommen wurde, jedoch der Zeitpunkt der Spiels frei wählbar war. Wie zu erwarten notierten die Teilnehmer der Versuchsgruppe (Wahlfreiheit) signifikant höhere Werte von Flow.

    In der Überprüfung des Einflusses von Persönlichkeitsvariablen stimmen die Ergebnisse nur teilweise mit den Erwartungen überein. Eine interne Kontrollüberzeugung, eine weitgehende Unabhängigkeit von Zufallseinflüssen, hohes Selbstvertrauen, handlungsorientierung, die Tendenz eine (schwierige) Situation als Herausforderung wahrzunehmen korrelieren hoch mit der Fähigkeit Flow zu erleben. Dies konnte in einer Reihe von Studien bestätigt werden (Logan, 1988; Massimini, Csikszentmihalyi und DelleFave, 1988). Hingegen zeigt sich kein Zusammenhang zur augenscheinlichen "spielerischen Grundhaltung", eine Skala die jedoch eher die Vorliebe für Freizeitaktivitäten und -verhalten im Verhältnis zu anderen Tätigkeiten mißt, anstatt Spannungsfreiheit und Lockerheit zu beleuchten. Überraschend auch das Ergebnis, dass es überhaupt keinen Zusammenhang zwischen Flow, Interneterfahrung und Internetsucht gibt.

    Bezüglich der Validierung und Messung von Flow sei anzumerken, dass neuerdings eine Vielzahl von Studien über Flow mit posthoc-Befragungen vermeintliche Flowerlebnisse erfassen. Dabei sei anzumerken, dass eine einmalige direkte Abfrage von Erlebnissen "..die vom Probanden als flow-ähnlich eingestuft werden (Hoffman, 1999)" mit sogenannten "Flowbögen" nicht in diesem Maße gültig sind, wie Zeitstichprobentagebücher, da sich der Betroffene in der Regel kaum an alle Flow-Aktivitäten erinnern kann, oft gar nicht weiß was mit "Flow" gemeint sei und zudem Flow schwer mit gewissen Tätigkeiten oder Situationen in Zusammenhang gebracht werden kann. Die Experience Sampling Method und, ganz allgemein, die Methode der Zeitstichprobentagebücher kann Flow dagegen direkt an der Tätigkeit und mit einer "höheren Auflösung" messen. Daher sind nach meiner Meinung die Überprüfung und Messung von Flow nur mit dieser zulässig.

    Schlußfolgerung

    Meines Wissens sind Untersuchungen von Flow, dem Zustand zwischen Langeweile und Angst, im Internet sehr rar. Da die Zahl der User von Tag zu Tag steigt und dieses Medium ein tragende Rolle in unserer Gesellschaft zu übernehmen beginnt, ist intensivere Forschung in diesem Bereich angebracht.

    Diese im deutschsprachigen Raum, erstmalig mit Zeitstichprobenaufzeichnungen, durchgeführte Studie zum Thema "Flow im Internet" soll sowohl dem eMarketing (insbesondere den Webpagedesignern), als auch den Forschern des Mediums, speziell jenen, die sich mit den gesundheitspsychologischen Auswirkungen beschäftigen, neues Wissen, Erkenntnisse und Denkanstöße vermitteln.

    Literatur (Auszug)
    Csikszentmihalyi, M. & Csikszentmihalyi, I. S. (1988). (Eds.). Optimal Experience. Psychological Studies of Flow in Consciousness. Cambridge University Press.
    Csikszentmihalyi, M. (1990). Flow. The Psychology of Optimal Experience. Harper & Row, Publishers, New York.
    Hahn, A. & Jerusalem, M. (2000). Entwicklung eines Diagnostischen Instruments zur Internetsucht und Befunde aus drei Online-Studien. Posterhandout. 42. Kongreß der deutschen Gesellschaft für Psychologie: Jena.
    Hahn, A. & Jerusalem, M. (2001). Internetsucht. URL: http://www.internetsucht.de
    Larson, R. (1988). Flow and writing. In M. Csikszentmihalyi & I. S. Csikszentmihalyi (Eds.), Optimal Experience. Psychological Studies of Flow in Consciousness. (p. 150-171). Cambridge University Press.
    Logan, R. D. (1988). Flow in solitary ordeals. In M. Csikszentmihalyi & I S. Csikszentmihalyi (Eds.), Optimal Experience. Psychological Studies of Flow in Consciousness. (p. 172-180). Cambridge University Press.
    Massimini, F., Csikszentmihalyi, M. and Delle Fave, A. (1988). Flow and biocultural evolution. In M. Csikszentmihalyi & I S. Csikszentmihalyi (Eds.), Optimal Experience. Psychological Studies of Flow in Consciousness. (p. 60-84). Cambridge University Press.
    McIlwraith, R. D. (1998). "I' m addicted to Television": The Personality, Imagination, and TV Watching Patterns of Self-Identified TV Addicts. Journal of Broadcasting & Electronic Media, 98, 371-386.
    Mielke, R. (1982). (Hg.). Interne, externe Kontrollüberzeugung : Theoretische und empirische Arbeiten zum Locus of Control-Konstrukt. Bern, Wien: Huber,
    Schubert,B. (1997). Das Flow-Erleben - Emotionale Aspekte des Flow bei MusikerInnen unter besonderer Berücksichtigung geschlechtsspezifischer Charakteristika. Unveröffentlichte Diplomarbeit: Universität Wien.
    Schwager, U. (1995). Das flow-Erleben von Mihaly Csikszentmihalyi als intreinsischer Motivationsfaktor beim Computerspielen. Unveröffentlichte Diplomarbeit: Universität Wien.
    Vitouch, P. (1996). (Hg.). Cognitive Maps und Medien : Formen mentaler Repräsentation bei der Medienwahrnehmung. Frankfurt am Main, Wien : Lang.

    (c) Robert Tzanetakis


    Utz, Sonja ; Institution: Department of Social Psychology, Free University of Amsterdam
    Article (version: 25/06/2002 - 07:47, size: 14000)
    "Verbalisierung sozioemotionaler Inhalte und der Aufbau von Freundschaften in virtuellen Gemeinschaften."
    German: Die Social Information Processing Perspective (Walther, 1992) beschreibt, wie in computervermittelter Kommunikation (cvK) trotz des Fehlens vieler nonverbaler Hinweisreize Eindrucksbildung und Aufbau von Freundschaften von statten gehen. Das Modell geht davon aus, dass auch über cvK sozioemotionale Inhalte vermittelt und Freundschaften aufgebaut werden können. Aufgrund der Restriktion auf Text bei textbasierter cvK dauert es allerdings länger, bis dieselbe Anzahl von Informationen übermittelt wird. Viele nonverbale Informationen, die in ftf-Kommunikation leicht ersichtlich sind, müssen in cvK explizit verbalisiert werden, bevor sie über das Medium Computer übertragen werden können. Nonverbale Informationen sind jedoch für den Aufbau von Freundschaften sehr wichtig, da sie vor allem sozioemotionale Inhalte transportieren. Ein Lächeln, ein verständnisvolles Nicken oder eine tröstende Umarmung können beispielsweise Sympathie und emotionale Unterstützung signalisieren. Die Frage, wie die cvK-Nutzer lernen, nonverbale Informationen aus den Botschaften des Interaktionspartners herauszulesen und selbst in cvK zu übermitteln, steht daher im Zentrum der SIP.

    Das Modell geht von der Grundannahme aus, dass die cvK-Nutzer motiviert sind, ein Bild von ihren InteraktionspartnerInnen zu gewinnen. Mit der Zeit lernen sie zunächst, aus den schriftlichen Nachrichten der anderen Informationen über die Interaktionspartner herauszulesen. Später erwerben sie selbst die Fähigkeit, an sich nonverbale Inhalte zu textualisieren. Dabei stehen ihnen verschiedene Strategien zur Verfügung. Am bekanntesten sind die sogenannten Smileys, kleine Gesichter aus Ascii-Zeichen, die Freude, Traurigkeit oder einen ironischen Unterton symbolisieren. Aber auch durch Rechtschreibung, Großschreibung (wird als Schreien aufgefaßt) oder durch die Verwendung sogenannter Akronyme lassen sich nonverbale Inhalte textualisieren. In vielen virtuellen Gemeinschaften hat sich eine spezifische Sprache unter den Mitgliedern entwickelt (z.B. Baym, 1995). In MUDs (multi-user-dungeons; textbasierte Abenteuerrollenspiele) gibt es die sogenannten Feelings, vordefinierte Verben und Adjektive. Dabei muß jeweils nur ein Wort bzw. die entsprechende Abkürzung eingegeben werden, es resultiert jedoch ein ganzer Satz. Die Eingabe "smi und Laurea" wird beispielsweise zu "You smile understandingly at Laurea". Sollten diese vordefinierten Feelings nicht ausreichen, den entsprechenden Sachverhalt auszudrücken, kann mit Hilfe der sogenannten Emotes beliebiger Text eingeben werden, der die eigene Spielfigur beschreibt. Diese Strategien (Smileys, Emotes, Feelings) werden im folgenden unter dem Begriff Emoticons zusammengefaßt.

    Die SIP wurde vor allem für asynchrone Kommunikationsszenarien formuliert. Asynchrone cvK ist zeitversetzte Kommunikation, das heisst, die Kommunikationspartner können in Ruhe über die Gestaltung und Formulierung nachdenken und sich in gewünschter Weise selbst präsentieren. Bei sychnroner, zeitgleicher cvK ist dies nicht möglich. Dennoch zeigte eine Studie an MUD-Nutzern (Utz, 2000), dass sich die Annahmen der SIP auch in diesen synchronen Kommunikationsszenarien bestätigen lassen: Die Nutzer erlernen den Umgang mit Emoticons mit der Zeit, und die Nutzung von Emoticons sagt auch den Aufbau von Freundschaften vorher.

    Allerdings wurde nicht überprüft, wie MUDder Emoticons wahrnehmen und bewerten. Setzen sie diese wirklich bewußt ein, um Emotionen auszudrücken, oder ist die Verwendung von Emoticons eine Norm innerhalb der MUDs? Aus einer Studie an Chats ist bekannt, dass die Verwendung bestimmter Smileys auch ein Zeichen der Zugehörigkeit zu einem bestimmten Chat sein kann (Sassenberg, in press). Die Frage nach der subjektiven Bewertung von Emoticons steht daher im Zentrum dieses Beitrags. Des weiteren wird untersucht, welche Rolle Motive beim Aufbau von Online-Freundschaften spielen. Die SIP geht davon aus, dass die cvK-Nutzer motiviert sind, die anderen Nutzer kennenzulernen. Allerdings sind gerade in MUDs auch alternative Nutzungsmotive denkbar. So können MUDs vor allem als ein Computer- oder Rollenspiel betrachtet werden. MUDs werden von den Spielern durch Programmieren weiterentwickelt, daher können sie auch als ein großes Programmierprojekt gesehen werden. Sind alle MUDder daran interessiert, Kontakte mit den anderen Spielern aufzubauen (socializing)? Wie wirkt sich die Motivation auf die Verwendung von Emoticons und den Aufbau von Online-Freundschaften aus?

    Empirische Studie

    Um diese Fragestellungen zu untersuchen, wurde eine Fragebogenstudie an MUDdern durchgeführt. Der Fragebogen wurde im WWW dargeboten. Neben demographischen Daten und Angaben zum MUD-Verhalten wurden die Motive für das MUDden, der Gebrauch und die Bewertung von Emoticons, der Aufbau von Online-Freundschaften, die Einstellungen zum MUD sowie die soziale Kontaktfähigkeit erfaßt (für eine ausführlichere Beschreibung s. Utz, in press).
    Die Stichprobe umfaßte 185 MUDderInnen, davon 35 weiblich. Der Großteil der TeilnehmerInnen kam aus den USA oder Kanada (70%), 20% stammten aus Europa. Die mittlere MUD-Erfahrung betrug 46 Monate (SD = 34), die mittlere MUD-Zeit pro Woche 22 Stunden (SD = 16).

    Nutzung von Emoticons und Aufbau von Online-Freundschaften
    Insgesamt berichten die MUDder, Freundschaften geschlossen zu haben, der Mittelwert auf der Skala Online-Freundschaften liegt mit M = 4.36 (SD = 1.20) signifikant über dem Mittelpunkt der verwendeten 6-Punkt-Skala, t(171) = 9.38, p < .001. Die Nutzung von Emoticons wurde auf einer fünfstufigen Skala erfaßt. Am häufigsten werden Emotes genutzt (M = 4.16), gefolgt von Feelings (M = 4.02) und Smileys (M = 3.49). Die Benutzung dieser Strategien korreliert auch modellgemäß mit dem Aufbau von Online-Freundschaften. Die größte Vorhersagekraft hatte dabei der Einsatz von Smileys, r(170) = .31, p < .001, gefolgt von dem von Emotes, r(169) = .24, p < .01. Die Verwendung von Feelings dagegen korrelierte nur zu r(170) = .14, p < .05, eins., mit dem Aufbau von Online-Freundschaften.

    Bewertung von Emoticons
    Auch wenn der Einsatz von Emoticons nur mäßig mit dem tatsächlichen Aufbau von Freundschaften korreliert, werden Emoticons doch als hilfreich beim Ausdruck von Gefühlen oder anderer nonverbaler Inhalte erlebt (vgl. Abb. 1 für ausgewählte Items).

    Die Nutzung von Emoticons wird jedoch kaum als Kennzeichen der Gruppenmitgliedschaft und damit als Norm der MUDder wahrgenommen. Die Bewertung von Emoticons auf der Subskala Kompensation (M = 4.13) war signifikant höher als die auf der Subskala Norm (M = 2.88), t(178) = 18.41, p < .001.

    Rolle von Motiven
    Nach der SIP sind die cvK-Nutzer grundsätzlich motiviert, interpersonale Kontakte aufzubauen. Allerdings steht diese Motivation nur bei einem relativ geringem Anteil der MUDder im Vordergrund: Nur 15.6% sind hauptsächlich am Chatten und Socializing interessiert (im folgenden Socializer genannt). Die größte Subgruppe (33.3%) muddet aus Interesse am Rollenspiel (Rollenspieler). Etwa ein Viertel der MUDder (26.7%) nennt das Lösen von Quests als Hauptmotivation (Spieler), während 24.4% vor allem am Programmieren interessiert sind (Programmierer). Neben der Hauptmotivation wurde auch die Bewertung des Aspekts Interaktion mit anderen MUDdern erfragt. Dabei zeigten sich die höchsten Werte für Socializer (M = 4.54) und Programmierer (M = 4.30), gefolgt von Rollenspielern (M = 4.23), und, deutlich geringer, Spielern (M = 3.97).

    Die Motivation beeinflußt jedoch den Aufbau von Freundschaften. Chatter und Programmierer weisen höhere Werte auf der Skala Online-Freundschaften auf als die Rollenspieler und Spieler. Die Gruppen unterscheiden sich auch in der Nutzung von Emoticons (s. Abb. 2).

    Während Chatter und Programmierer alle drei Formen gleichermaßen einsetzen, zeigt sich bei den Rollenspielern eine Vorliebe für Emotes. Die Spieler benutzen bevorzugt Feelings.

    Getrennte Regressionen für die einzelnen Spielertypen zeigen, dass die Verwendung von Emoticons nur für Rollenspieler (F(3,50) = 9.79, p < .001, R Square = .33) und Spieler (F(3,44) = 2.93, p < .05, R Square = .11) einen signifikanten Beitrag zur Vorhersage von Online-Freundschaften leistet. Während bei den Rollenspielern vor allem der häufige Einsatz von Smileys mit mehr Freundschaften einhergeht (Beta = .40, p < .001), ist es bei den Spielern die Verwendung von Emotes (Beta = .42 p < .05). Für Socializer ergibt sich nur eine Tendenz für den Einsatz von Smileys (Beta = .30, p < .10).

    Diskussion

    Über alle MUDder hinweg, zeigte sich der nach der SIP zu erwartende Zusammenhang zwischen Einsatz von Emoticons und dem Aufbau von Online-Freundschaften. Allerdings waren die Korrelationen nur von mäßiger Höhe, so dass davon auszugehen ist, dass weitere Faktoren den Aufbau von Online-Freundschaften bestimmen. Aus der Literatur zu interpersonalen Beziehungen ist bekannt, dass Faktoren wie Ähnlichkeit oder self-disclosure den Aufbau von Freundschaften begünstigen. Zudem zeichnete sich die Stichprobe durch eine sehr hohe durchschnittliche MUD-Erfahrung aus, im Schnitt lag diese bei fast vier Jahren. Die Verwendung von Emoticons spielt dagegen vor allem am Beginn des Kennenlernprozesses eine große Rolle.
    Emoticons werden aber bewußt eingesetzt, um den Mangel nonverbaler Hinweisreize zu kompensieren, und sie werden auch als hilfreich im Ausdrücken von subtilen Nuancen und Gefühlen erlebt. Insofern wurde die SIP bestätigt.

    Die Annahme, dass cvK-Nutzer motiviert sind, die Interaktionspartner näher kennenzulernen, muß jedoch eingeschränkt werden. Diese Motivation mag zwar bei allem Spielern zu einem gewissen Grade vorhanden sein, allerdings zeigen sich erhebliche Unterschiede zwischen einzelnen Gruppen von MUDdern. Nur ein kleiner Bruchteil gibt als Hauptmotivation für die Teilnahme an MUDs das Interesse am Chatten und Socializing an. Programmieren und (Rollen)spiel stehen für weit mehr MUDder im Vordergrund.

    Die Motivation beeinflußt jedoch den Aufbau von Online-Freundschaften. Personen, die hauptsächlich am Kennenlernen anderer MUDder oder am Programmieren interessiert sind, weisen signifikant höhere Werte auf der Skala Online-Freundschaften auf als MUDder, die vor allem am Lösen von Quests und am Rollenspiel interessiert sind. Die hohen Werte der Programmierer auf der Skala Online-Freundschaften sind vermutlich auf deren lange Zugehörigkeit zum MUD zurückzuführen. Erst ab einer bestimmten Spielstufe erlangen die MUDder das Recht, die virtuelle Welt durch Programmieren weiterzuentwickeln.

    Die vier Typen, die anhand ihrer Hauptmotivation unterschieden werden können, unterscheiden sich auch in der Verwendung von Emoticons. Während Socializer und Programmierer alle Formen jeweils sehr häufig einsetzen, ergeben sich bei Spielern und Rollenspielern unterschiedliche Muster. Rollenspieler setzen vor allem Emotes ein. Bei dieser Gruppe ist jedoch anzunehmen, dass diese Emotes die Emotionen der Spielfigur, nicht zwangsläufig der eigenen Person beschreiben. Für die Vorhersage von Online-Freundschaften leistet nur die Verwendung von Smileys einen signifikanten Beitrag. Bei den Spielern zeigt sich ein anderes Muster: Sie setzen Smileys häufiger ein, bei ihnen erklärt aber die Verwendung von Emotes das Entstehen von Freundschaften. Die Spieler nutzen Emotes seltener als die anderen drei Gruppen. Spieler sind vor allem am Lösen von Quests, Steigern der Fähigkeiten ihrer Spielfigur und ihrer Position in der Topliste interessiert. Wenn ein Spieler Emotes einsetzt, fördert dies den Aufbau von Online-Freundschaften. Bei Socializern und Programmierern hat die Verwendung von Emoticons keinen Einfluß auf die Online-Freundschaften. Allerdings nutzen beide Gruppen alle Arten von Emoticons sehr häufig und dementsprechend routiniert, so dass diese Variable nicht mehr zwischen einzelnen MUDdern differenziert. Zudem sind Socializer und Programmierer stärker an der Interaktion mit den anderen MUDdern interessiert als die anderen beiden Gruppen, t(174) = 3.04, p < .01.

    Der Einsatz von Emoticons hat also nur für die Gruppen mit geringerem Interesse am Kennenlernen der anderen MUDder Vorhersagekraft. Das heißt, vor allem Personen, die nicht primär am Aufbau von Online-Freundschaften interessiert sind, profitieren vom Einsatz von Emoticons. Dieses Ergebnis hat durchaus auch Konsequenzen für virtuelle Teams in Organisationen. Gerade im organisationalen Kontext liegt der Fokus hauptsächlich auf der Aufgabe. Wenn auch ein gutes Klima im Team keine notwendige Voraussetzung für erfolgreiche Arbeit ist, so sind doch häufige Mißverständnisse, die durch mangelnde Beherrschung von cvK bedingt sind, hinderlich für die Erledigung der Aufgabe. Gerade in aufgabenorientierten Kontexten ist es daher wichtig, dass die Kommunikationspartner nicht nur die Bedienung der Technik, sondern auch die Vermittlung sozioemotionaler Inhalte in cvK beherrschen.

    Literatur

    Baym, N.K. (1995). The emergence of community in computer-mediated communication. In S.G. Jones (Ed.), CyberSociety: Computer-mediated communication and community (pp. 138-163). Thousand Oaks: Sage.

    Sassenberg, K. (in press). Common bond and common identity groups on the Internet: Attachment and normative behavior in on-topic and off-topic chats. Group dynamics. Theory, Research, and Practice.

    Utz, S. (in Druck). Der Aufbau von interpersonalen Beziehungen in MUDs: Die Rolle von Motiven und Kommunikationsstrategien. Gruppendynamik und Organsationsberatung.

    Utz, S. (2000). Social Information Processing in MUDs: The development of friendships in virtual worlds. Journal of Online Behavior, 1 (1). On-line. Available: http://www.behavior.net/JOB/v1n1/utz.html [15.11.2000]

    Walther, J.B. (1992). Interpersonal Effects in Computer-Mediated Interaction: A Relational Perspective. Communication Research, 19, 52-90.


    Voracek, Martin ; Stieger, Stefan Institution: Univ.-Klinik für Tiefenpsychologie und Psychotherapie, Universität Wien
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "A Warning against University Subject Pools: Majors-differentiated evidence in an online survey of sexual behavior."


    Weichbold, Martin ; Siegetsleitner, Anne Institution: Institut für Kultursoziologie, Paris-Lodron-Universität Salzburg
    Article (version: 25/06/2002 - 07:47, size: 22907)
    "Ethische Aspekte einer Online-Befragung."
    German: Martin Weichbold (Institut für Kultursoziologie der Universität Salzburg)
    Anne Siegetsleitner (Forschungsinstitut für angewandte Ethik der Universität Salzburg)

    Ethische Aspekte einer Online-Befragung

    Einleitung

    Sozialforschung kann es sich heute nicht (mehr) leisten, auf das Prädikat "ethisch unbedenklich" zu verzichten, zumal sich die gesamte wissenschaftliche Forschung einer ständigen gesellschaftlichen Legitimierung stellen muss. Mit dem Einsatz sozialforscherischer Methoden in Computernetzen, insbesondere im Internet, hat die Forschungsethik einen neuen Stellenwert erreicht, da mit der Vernetzung und der elektronischen Verarbeitung der Daten auch die Möglichkeiten zu deren Missbrauch potenziert wurden.

    Sozialforscher/innen sind in der Regel weder Ethiker/innen noch Jurist/inn/en. Forschungsethik wird daher meist als ein angesichts schwarzer Schafe in der Branche notwendiges Übel betrachtet, das den Forschungsfortschritt eher hemmt: Selbst hat man ja nie die Absicht, jemand anderem zu schaden. Ihren Ausdruck findet die Forschungsethik zum einen in gesetzlichen Regelungen, zum anderen in selbst auferlegten Verhaltenscodizes von Berufsvereinigungen und Standesvertretungen. Das Verhältnis der meisten Sozialforscher/innen zum Thema Ethik ist wohl: möglichst nie mit diesem Thema zu tun bekommen.

    Der Stellenwert der Ethik wird auch im Internetportal www.online-forschung.de deutlich: Sie gehört natürlich zum Thema, aber eben am Rande und wurde dementsprechend unter der letzten Kategorie "Drumherum" eingereiht. Ob diese Einordnung bewusst gemacht wurde oder ob sie sich einfach "ergeben" hat - ich denke, dass sie symptomatisch ist für die Rolle der Ethik in der Sozialforschung.

    Mit dem Begriff Forschungsethik werden meist die Gegensatzpaare richtig - falsch bzw. gut - schlecht verbunden, wobei die Betonung eindeutig auf dem negativen Pol liegt: Für den Fall, dass man sich "ethisch problematisch" verhält, werden Sanktionen und Ächtung angedroht. Wir wollen für einen anderen Zugang zur Forschungsethik plädieren, einen Zugang, der über den Gegensatz gut - schlecht hinausgeht und nicht nur auf eine Einschränkung der Forschertätigkeit abzielt.

    Zu Beginn steht die Überlegungen, dass "Ethik" kein eindimensionales und damit auch kein eindeutiges Bewertungskriterium ist, sondern eine Reihe unterschiedlicher und mitunter auch gegensätzlich wirkender Facetten aufweist. Ziel ist es, ein Raster zu entwickeln, das nicht nur ethische Grenzen der Forschung aufzeigt (wie dies die gesetzlichen oder Standesregelungen tun), sondern das in den vielen Entscheidungsprozessen der Forschung hilft, mögliche Probleme im vorhinein zu vermeiden, und Verbesserungsvorschläge liefert. Ergebnis wird nicht unbedingt ein "richtiges" Forschungsdesign sein, aber vielleicht ein insgesamt "besseres".

    Was ist "ethisch problematisch"?

    In unserer Bewertung orientieren wir uns an vier ethischen Prinzipien , die in ethischen Fragen heute üblicherweise als Orientierungsrahmen dienen (1): (A) dem Prinzip der Selbstbestimmung (Autonomie), (B) dem Prinzip der Übelminimierung, (C) dem Prinzip der Wertsteigerung und (D) dem Prinzip der Gerechtigkeit. Philosophisch gesehen handelt es sich dabei um Prinzipien mittlerer Abstraktionsebene, die von den unterschiedlichen ethischen Theorien wie beispielsweise der Kantischen oder jener des Utilitarismus gestützt werden und von einem breiten Konsens (zumindest in unserer Gesellschaft) getragen werden. Erfahrungen in der Praxis haben gezeigt, dass Debatten auf dieser Ebene fruchtbringender sind als rein theoretische Auseinandersetzungen.

    (A) Autonomie

    Das Prinzip der Autonomie basiert auf der Annahme, dass Menschen über die Fähigkeit verfügen, einen rationalen Plan zur Umsetzung ihrer Vorstellung von einem guten Leben zu entwickeln. Das Prinzip der Autonomie fordert die Respektierung dieser Fähigkeit. So soll es jemandem nicht unmöglich gemacht werden, autonome Entscheidungen zu treffen. Um eine autonome Entscheidung treffen zu können, müssen jedoch Bedingungen erfüllt sein. Wer autonom entscheidet, muss

    1. hinreichend verstehen, worüber er/sie entscheidet und was diese Entscheidung nach sich zieht (hierzu muss er/sie wiederum urteilsfähig und informiert sein)
    2. von steuernden Einflussnahmen anderer Personen frei sein.

    Wer die Ansichten und Pläne anderer ignoriert, diese vereitelt oder andere bewusst falsch informiert oder manipuliert, respektiert daher ihre Autonomie nicht. Heute gilt das Prinzip der Autonomie meist als wichtigstes Prinzip; eine autonome Zustimmung bedeutet quasi einen ethischen Persilschein. Das Prinzip der Autonomie gilt als Basis aller Rechte auf Privatsphäre und Datenschutz. Besonders das Datenschutzrecht der Bundesrepublik Deutschland ist ausdrücklich als Recht zur sogenannten "informationellen Selbstbestimmung" konzipiert. In Debatten um den Datenschutz steht deshalb häufig die Frage nach einer informierten Einwilligung im Mittelpunkt. Vor diesem Hintergrund ist auch das Bestreben zu sehen, Einwilligungen von Forschungsteilnehmer/inne/n zu erhalten.

    (B) Minimierung von Übel

    Das Prinzip der Übelminimierung, das im Alltag meist seinen Ausdruck in der Forderung findet: "Füge niemandem ein Übel zu!", kann wohl als ethische Minimalforderung gesehen werden. In dieser Formulierung geht es nur darum, nicht selbst neues Übel (neuen Schaden, neues Leid) zu verursachen. Das Prinzip der Übelminimierung umfasst jedoch auch das Gebot, neues Übel zu verhindern und bereits vorhandenes Übel zu beseitigen. Was nun als Übel zu werten ist und in welchem Ausmaß Übel zu verhindern und zu beseitigen ist, ist durchaus Gegenstand ethischer Diskussionen. Die philosophische Ethik gibt nicht vor, hier alle Antworten parat zu haben!

    (C) Steigerung von Nutzen

    Eine Ethik verlangt meist nicht nur, Übel zu minimieren, sondern auch Positives zu schaffen und zu unterstützen. Es wird verlangt, anderen zu helfen und Gutes zu tun (ihr Wohlbefinden, ihre Lebensqualität usw. zu erhöhen). Nicht zuletzt die Wissenschaft sucht ihre gesellschaftspolitische Legitimation immer wieder in diesem Prinzip.

    (D) Gerechtigkeit

    Das letzte der vier Prinzipien ist das Prinzip der Gerechtigkeit. Bei allen Unterschieden ist den meisten Gerechtigkeitstheorien ein formales Prinzip gemein, das zumindest bis auf Aristoteles zurückgeht: Gleiche Fälle sollen gleich behandelt werden, ungleiche ungleich. Damit ist noch nicht gesagt, welches Kriterium für den Vergleich herangezogen werden soll. Darin unterscheiden sich die Ansätze: die einen orientieren sich am Verdienst, die anderen an Bedürfnissen. Im übrigen sind es nicht immer nur Güter, die es zu verteilen gilt, sondern auch Lasten.

    Typische Probleme der Gerechtigkeit in Forschungsfragen sind:
    · Sollen alle Betroffenen gleich viele Vor- und Nachteile durch die Untersuchung haben?
    · Profitiert jemand (bzw. eine Gruppe), die wenig oder kaum dazu beigetragen hat, besonders stark von einer Untersuchung?
    · Hat jemand (bzw. eine Gruppe) besonders viel beigetragen, profitiert jedoch nicht davon?

    Gleich vorweg: Diese vier Prinzipien geben auf ethische Fragen keine eindeutigen Antworten. Sie können untereinander in Konflikt geraten und oft muss eine Entscheidung fallen, welches Prinzip Vorrang hat. Die Verantwortung dafür wird nicht abgenommen. Dennoch sind sie sehr hilfreich, wenn es darum geht, ethische Probleme eines Forschungsvorhabens zu entdecken und nicht zu leichtfertig oder unüberlegt über wichtige Fragen hinwegzugehen. Nicht selten lassen sich Forschungsabläufe so abändern, dass auf mehreren dieser Dimensionen ein höherer Wert erreicht wird. Oft gelingt dies sogar ohne Abstriche beim Forschungsziel.


    Ein Beispiel

    Das ethische Bewertungsraster soll an einer Internet-Befragung verdeutlicht werden, die Ende letzten Jahres im Rahmen einer Diplomarbeit durchgeführt wurde (2). Das Raster wird im Nachhinein an diese Befragung angelegt. Thema der Befragung war die Bewertung des Internetauftritts einer Tourismusdestination (Stadt Salzburg) durch die Besucher der Site, verbunden mit Fragen zum Informations- und Buchungsverhalten bei Urlaubsreisen allgemein und üblichen Angaben zur Person. Darüber hinaus sollten mit der Untersuchung Methodeneffekte getestet werden, d.h. die Form der Befragung wurde nach verschiedenen Gesichtspunkten variiert, um Unterschiede in der Attraktivität der Ankündigung und im Antwortverhalten feststellen zu können.

    Zur ethischen Bewertung ist es zunächst notwendig, die an der Befragung Beteiligten zu differenzieren. Grob gesprochen stehen den "Durchführenden" die Teilnehmer gegenüber. Zu den "Durchführenden" zählen wiederum Personen oder Institutionen mit unterschiedlichen Interessen am Projekt (Auftraggeber, dessen Seite evaluiert wurde; Diplomand, der die Untersuchung durchführte; Betreuer der Diplomarbeit; jene Firma, auf deren Server die Umfrage installiert wurde). Wir gehen davon aus, dass sich alle Beteiligten informiert und freiwillig an dem Projekt beteiligten und lassen Überlegungen zum Verhältnis der Durchführenden untereinander beiseite (etwa ob die Relation zwischen Kosten und Nutzen für alle gerecht war). Im Blickpunkt steht eine ethische Bewertung von vier Problembereichen in der Gegenüberstellung von Durchführenden und Teilnehmern anhand des vorgestellten Rasters. Alternativvorschläge sollen zudem "bessere" Lösungen aufzeigen.


    Problem 1: Über das offensichtliche Thema der Umfrage hinaus war ein Methodenexperiment Teil des Untersuchungsdesigns. Den Befragten wurden unterschiedliche und per Zufallsgenerator ausgewählte Versionen des Fragebogens vorgelegt, um Ankündigungs- und Fragebogeneffekte zu untersuchen. Die Befragten wurden über diesen Teil der Untersuchung nicht informiert.
    Ethische Bewertung: Dieser Bereich war zentrales Thema der Diplomarbeit und damit Kern der Untersuchung. Dem Nutzen für die Durchführenden steht die beschnittene Autonomie der Befragten gegenüber: ihre Teilnahme erfolgte ohne volle Information darüber, was mit ihren Angaben über das offenbare Thema der Befragung hinaus passiert, strenggenommen kann man also nicht von einer informierten Zustimmung sprechen. Andere Aspekte sind hier nicht berührt, die Befragten hatten durch diese Vorgangsweise weder einen zusätzlichen Nutzen noch einen Schaden. Der Gerechtigkeitsaspekt wird geringfügig dadurch berührt, dass das Ausfüllen je nach Fragebogenversion unterschiedlich viel Zeit (und damit Kosten) erforderte. Da auch in der aufwendigsten Fragebogenfassung die mittlere Dauer für das Ausfüllen bei 15 Minuten lag, ist dieser Aspekt jedoch vernachlässigbar.

      Autonomie Übelminimierung Wertsteigerung Gerechtigkeit
    Teilnehmer
    !
    - -
    - -
    - -
    Durchführende
    - -
    - -
    !
    - -

    Alternativen: Da eine Information über die Methodenuntersuchung vor der Befragung für den Zweck der Befragung kontraproduktiv gewesen wäre (und den Nutzen der Untersuchung in diesem Punkt gefährdet hätte), wäre eine Information im Nachhinein denkbar. Diese hätte die Autonomie der Befragten freilich nur erhöht, wenn damit die Möglichkeit bestanden hätte, den Datensatz wieder zu löschen (also die Zustimmung nach vollständiger Information wieder zurückzuziehen).

    Problem 2: Neben den Antworten auf die Fragen wurden Datum und Uhrzeit, Browserversion und Bildschirmauflösung erhoben. Zur Kontrolle der Mehrfachteilnahme wurde ein Cookie gesetzt und die IP-Adresse protokolliert.
    Ethische Bewertung: Die Daten wurden zum einen zur Feststellung diverser Einflussfaktoren, zum anderen zur Vermeidung eines Bias durch Mehrfachteilnahmen erhoben, also um aus Sicht der Durchführenden (Erkenntnis-)Wert zu steigern und Schäden zu minimieren. Für die Teilnehmer war dadurch keine Steigerung des Nutzens gegeben, (negativ) betroffen sind aus ihrer Sicht aber die Bereiche "Übelminimierung" und "Autonomie". Bei der Frage eines Schadens ist ein solcher zwar tatsächlich nicht eingetreten, zu berücksichtigen ist aber auch die Möglichkeit eines solchen, etwa infolge Missbrauchs der erhobenen Daten durch Dritte.
    Was eine mögliche Verletzung der Autonomie betrifft, ist zu diskutieren, wie viel Wissen um technische Vorgänge beim Surfen im Internet bei den Usern vorausgesetzt werden kann. Im Rahmen der Umfrage wurde nicht darauf hingewiesen, dass die oben genannten Daten mit erhoben werden. Man könnte sich nun darauf berufen, dass diese Angaben bei jeder Datenübertragung automatisch generiert werden; auch Cookies können nur gesetzt werden, wenn der User es zulässt. Tatsächlich ist aber die Standardeinstellung der Browser so, dass Cookies zugelassen werden; vielen Usern dürfte das gar nicht bewusst sein. Das Vorhandensein einer "informierten Einwilligung" ist jedenfalls fraglich, ebenso ob die Information auch bezüglich ihrer Konsequenzen hinreichend verständlich ist.

     

      Autonomie Übelminimierung Wertsteigerung Gerechtigkeit
    Teilnehmer
    ?
    ?
    - -
    - -
    Durchführende
    - -
    !
    !
    - -

    Alternativen: Zunächst ist zu klären, welche Daten für eine Untersuchung tatsächlich gebraucht werden. Allein die Tatsache, dass eine Information vorhanden ist, erfordert ja nicht, dass diese auch verarbeitet werden muss. Werden solche Daten also benötigt, kann das Risiko eines Schadens und ein möglicher Schaden selbst möglichst gering gehalten werden, indem bekannte Maßnahmen gesetzt werden (getrennte Speicherung personenbezogener Daten; Löschen dieser Angaben, sobald sie nicht mehr benötigt werden; Zugangskontrolle zu Daten). Bezüglich der Autonomie der Befragten sind Verbesserungen schwieriger: ein expliziter Hinweis kann kontraproduktiv sein und dem Untersuchungszweck zuwiderlaufen, wenn dadurch viele User (vor allem solche, die über die technischen Vorgänge nicht oder nur unzureichend Bescheid wissen) abgeschreckt werden (vgl. "Mustertext für die Einwilligung in die Einrichtung eines ‚Cookies' zu Forschungszwecken" des ADM).

    Problem 3: Die Antworten wurden nicht auf dem Server des Auftraggebers, sondern auf dem einer dritten Firma gespeichert. Die Befragten wurden davon nicht in Kenntnis gesetzt. Nach Ende der Befragung wurden sie automatisch wieder zur ursprünglichen Adresse zurückgeleitet.
    Ethische Bewertung: Die Gründe für diese Vorgangsweise waren zum einen praktischer Natur, weil der Programmierer auf "seinem" Server leichteren Zugang hatte. Zudem hatte der Auftraggeber Sicherheitsbedenken (wollte also "Schaden vermeiden") . Dem steht seitens der Teilnehmer wieder eine Beschneidung ihrer Autonomie gegenüber, da sie über die Vorgangsweise nicht informiert wurden. Dazu kommt die Frage eines möglichen Schadens; da durch die Weiterleitung der Daten auf den anderen Server mehr Personen potentiell Zugang zu den Daten haben, steigt auch die Möglichkeit eines Datenmissbrauchs.

     

      Autonomie Übelminimierung Wertsteigerung Gerechtigkeit
    Teilnehmer
    !
    ?
    - -
    - -
    Durchführende
    - -
    !
    !
    - -


    Alternativen: Bei der gewählten Vorgangsweise ist eine Verbesserung durch verstärkte Sicherung gegen Datenmissbrauch angezeigt. Hinsichtlich der Autonomie der Teilnehmer ist abzuwägen, wie sehr ein Hinweis auf den Wechsel zu einem anderen Server die Teilnehmer verunsichern könnte und daher kontraproduktiv wäre. Beide Problembereiche wären vermieden worden, wenn die Sammlung der Daten auf dem Server des Auftraggebers erfolgt wäre. Das hätte im Gegenzug einen höheren Aufwand für Klärung und Beseitigung der Sicherheitsbedenken und eine umständlichere Administration bedeutet.

    Problem 4: Einem Teil der Besucher der Website wurde ein Gewinnspiel angekündigt, der Rest wurde um die Teilnahme an einer Befragung gebeten. In beiden Fällen war derselbe Fragebogen zu beantworten, auch jene, die an der "Umfrage" teilnahmen, erhielten nach der letzten Frage die Gewinnmöglichkeit.
    Ethische Bewertung: Während für die Durchführenden der Wunsch nach Erkenntnissen über die Wirkung unterschiedlicher Ankündigungen den Ausschlag für dieses Untersuchungsdesign gab, war es den Teilnehmenden gegenüber eine Frage der Gerechtigkeit, die Gewinne unter allen, die die Fragen beantwortet haben, zu verlosen. Streng genommen war es zwar eine Einschränkung der Autonomie, dass die "Umfrage"-Teilnehmer zunächst nichts von der Gewinnmöglichkeit wussten, angesichts des zusätzlichen (zumindest potentiellen) Nutzens dürfte das aber nicht schwer wiegen. Für die Durchführenden bedeutete diese Vorgangsweise zudem keinen zusätzlichen Aufwand.

     

      Autonomie Übelminimierung Wertsteigerung Gerechtigkeit
    Teilnehmer
    ?
    - -
    !
    !
    Durchführende
    - -
    - -
    !
    - -

     

    Resümee

    Mit dem von uns verwendeten Ansatz gibt es keine "ethisch korrekte" Konzeption und Durchführung einer Befragung und daher auch kein Patentrezept. Im Laufe eines Projektes sind jedoch viele Entscheidungen zu treffen, die ethische Aspekte bei Beteiligten in unterschiedlicher Weise betreffen, was Abwägungen erfordern kann. Mitunter bedeutet eine Entscheidung zugunsten des einen Prinzips zugleich eine Entscheidung zulasten eines anderen. Oft ist es aber auch möglich, mit geringen Abstrichen bei einer Dimension einen weitaus größeren Vorteil in einer anderen zu erreichen. Das vorgestellte Analyseraster macht mögliche Problemfelder bewusst. Eine Entscheidung kann und will es dem Forscher aber nicht abnehmen.

     

    Anmerkungen

    (1) Gut verständlich dargelegt finden sich diese Prinzipien in Beauchamp, T.L. und Childress, J.F. (1994): Principles of Biomedical Ethics, 4. Auflage. Oxford University Press.

    (2) Ergebnisse dieser Untersuchung im Artikel von Rager/Weichbold in diesem Band.


    Weßels, Martin ; Zimmermann, Matthias Institution: Dialego Online Market Research GmbH, Aachen
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Offline-rekrutierte Access-Panels als „Königsweg“ der panelbasierten Online-Forschung? Erkenntnissgewinne durch das „Dialego-Repräsentativpanel“."


    Witthöft, Michael ; Wilhelm, Oliver Institution: Lehrstuhl Psychologie II, Universität Mannheim
    Article preliminary article (version: 25/06/2002 - 07:47, size: 512)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "WWW-based Studies on the Construct Validity of Cognitive Failure Questionnaires."


    Döbler, Thomas ; Wolf, Malthe; Schenk, Michael Institution: Fachgebiet für Kommunikationswissenschaft, Institut für Sozialwissenschaften, Universität Hohenheim
    Article (version: 25/06/2002 - 07:47, size: 20044)
    "Das Konzept der Sozialen Milieus und die Analyse von Online- und E-Commerce-Nutzung"
    German:

    Das Konzept der Soziale Milieus und die Analyse von Online- und E-Commerce-Nutzung

    Thomas Döbler, Malthe Wolf & Michael Schenk

    Immer kürzere Produkt-Lebens- bzw. Innovationszyklen, vielschichtige Konsumentenpräferenzen sowie der soziokulturelle Wandel, besonderes aber die Vernetzung der Gesellschaft und Wirtschaft durch das Internet stellen immer größere Anforderungen an die Marktstrategien der Unternehmen. Differenzierte, vielschichtige Kenntnisse über die Kunden sind damit unerlässlich. Um diese Herausforderungen zu meistern, bedienen sich Marktforschungsinstitute, Medienunternehmen und Markenartikel-Hersteller schon seit einiger Zeit des Instruments der so genannten "Sozialen Milieus" wie es etwa vom Sozialwissenschaftlichen Institut für Gegenwartsfragen (Sigma) kontinuierlich weiterentwickelt wird. Mit diesen Milieus gelingt die mehrdimensionale, ganzheitliche Erfassung und Gruppierung von Menschen in soziale Einheiten; Wertorientierungen und Alltagseinstellungen zu Aspekten wie Konsum, Freizeit, Geld, Familie und Medien definieren die Sozialen Milieus und werden als Instrument genutzt, Produkte an den Präferenzen der Kunden auszurichten.

    Die heute bereits unübersehbare, sich in den kommenden Jahren noch exponentiell verstärkende Bedeutung des Internet in allen Bereichen unseres Wirtschaftens und des privaten Alltags legt eine Betrachtung dieser neuen Handels- und Informationsplattform unter Bezug auf die Sozialen Milieus nahe - und wird beispielsweise von SevenOne Interactive auch bereits praktiziert.2 Von besonderem Interesse ist hierbei, die Lebenswelten und Lebensstile von Online- und E-Commerce-Kunden, aber auch die von Nichtnutzern präzise beschreiben zu können. Darüber hinaus erlaubt die Kristallisation von besonders aufgeschlossenen und aktiven Gruppen der Gesellschaft auf der einen und eher abwartenden und reservierten Teilen der Bevölkerung auf der anderen Seite Ableitungen zur weiteren Diffusion des Internet und seiner unterschiedlichen Nutzung.

    Soziale Milieus und Internetnutzung

    Der Begriff des Milieus - ganz ähnlich auch der des Lebensstils - hat in den letzten 20 Jahren eine Renaissance ungeahnten Ausmaßes erlebt. Reichen die Ursprünge des Begriffs bis in die französische Aufklärung hinein, beinhaltete er in seiner weiteren Ausformulierung im Zuge der Industrialisierung schon damals die Verschmelzung von objektiven und subjektiven Faktoren geriet der Begriff im 20. Jahrhundert und insbesondere nach dem 2. Weltkrieg mehr und mehr in den Hintergrund und wurde zunächst von Klassen-, später von Schichtmodellen abgelöst (Hradil 1990). Die Wiederentdeckung des Milieukonzepts in den 80er Jahren des 20. Jahrhunderts begründet sich insbesondere in der abnehmenden Aussagekraft der herkömmlichen Klassen- und Schichtkonzepte. Klassen- und Schichtmodelle konzentrieren sich auf die vertikalen, durch Beruf, Bildung und Einkommen bedingten Unterschiede während die horizontalen wie z.B. Alter, Geschlecht oder Region, aber auch Bedürfnisse, Einstellungen und Werthaltungen eher vernachlässigt werden, ja lange Zeit vernachlässigbar schienen. Doch die durch Werteveränderungen und Lockerungen der klassenkulturellen, regionalen und familialen Bindungen stattfindende Pluralisierung der Lebensstile erforderte eine Erweiterung und Ergänzung der auf sozialstrukturellen Indikatoren beruhende Schichtung der Gesellschaft. Insbesondere auch das Marketing verlangte nach Konzepten, um das durch objektive Lebensbedingungen nur mehr bedingt erklärbare und vorhersehbare Konsumverhalten der Verbraucher wieder besser "in den Griff" zu bekommen. Da der Milieuansatz an der umfassenden Ästhetisierung der Alltagswelt ansetzt, ist er auch für die Analyse des Käuferverhaltens brauchbar. Soziale Milieus versuchen Menschen mit jeweils charakteristischen Einstellungen und Lebensorientierungen zu beschreiben. Sie fassen, ganz allgemein gesprochen, soziale Gruppen zusammen, deren Wertorientierungen, Lebensziele, Lebensstile und damit auch Konsummuster ähnlich sind (Hartmann 1999, 70f.).

    Indem Milieumodelle auf den ganzen Menschen, auf das gesamte Bezugssystem seiner Lebenswelt abzielen, sollen damit die Tiefenstrukturen sozialer Differenzierung erfasst werden. Der Milieubegriff nimmt Bezug auf soziale Syndrome, bestehend aus sozialen Lagen einerseits und Wertorientierungen sowie lebensweltlichen Sinn- und Kommunikationszusammenhängen andererseits, Elemente also, die sich im Leben der meisten Menschen nur langfristig verändern. So neigt auch das Milieugefüge zur Stabilität - es verändert sich nur allmählich. Dabei liegt es in der Natur der Sache, das heißt der sozialen Wirklichkeit, dass die Grenzen zwischen den Milieus fließend sind, dass die Lebenswelten nicht so (scheinbar) exakt etwa nach Einkommen, Schulabschluss oder Berufsgruppenzugehörigkeit eingrenzbar sind wie soziale Schichten.

    Das Konzept der Sozialen Milieus von Sigma, nur eines, allerdings sehr populäres aus der Vielzahl der unterschiedlichen Milieukonzepte (Vester, M. et al. 1993), positioniert die einzelnen Milieus entlang der beiden Dimensionen ísoziale Lage' und íGrundorientierung in der Wertorientierung' (s. Abb. 1)

     

    Abbildung 1 Soziale Milieus in der Bundesrepublik Deutschland

    Wie die Abbildung zeigt, werden Milieus mit steigender(m) Bildung, Einkommen und Berufsgruppe nach oben in der Milieulandkarte platziert; je weiter sie nach rechts zu liegen kommen, um so weniger traditionell sind die Milieus in ihren Grundorientierungen. Die hier differenzierten zehn Milieus können dabei noch in die folgenden vier Obergruppen zusammengefasst werden (Ascheberg, C., J., Ueltzhöffer 1999).

    • Die Gesellschaftlichen Leitmilieus (26 %):
      • Etabliertes Milieu (10 %): Die erfolgsorientierte Konsum-Elite mit ausgeprägten Exklusivitätsanspruch.
      • Intellektuelles Milieu (10 %): Die postmateriell orientierte Werteavantgarde.
      • Postmodernes Milieu (6 %): Die individualistische "multi-optionale" Lifestyle-Avantgarde
    • Der Moderne Mainstream (34 %):
      • Modernes Arbeitnehmermilieu (8 %): Der gut ausgebildete, mobile und Mainstream der jungen modernen Mitte.
      • Statusorientiertes Milieu (18 %): Das beruflich und sozial aufstrebende Segment der modernen Mitte - die Erfolgsinsignien unserer Konsumgesellschaft im Blick.
      • Modernes bürgerliches Milieu (8 %): Die konventionelle neue Mitte, die nach einem harmonischen, behüteten Leben in gesicherten Verhältnissen strebt.
    • Der Traditionelle Mainstream (19 %):
      • Traditionelles bürgerliches Milieu (14 %): Die Sicherheits- und Status-quo-orientierte Kriegsgeneration, die an den traditionellen Werten wie Pflicht und Ordnung festhält.
      • Traditionelles Arbeitermilieu (5 %): Die an den Notwendigkeiten des Lebens ausgerichtete traditionelle Arbeiterkultur der Eckkneipen, Kleintierzüchter- und Schützenvereine.
    • Die Moderne Unterschicht (21 %):
      • Konsum-materialistisches Milieu (10 %): Die stark materialistisch geprägte Unterschicht, die Anschluss halten will an die Konsum-Standards der breiten Mitte.
      • Hedonistisches Milieu (11 %): Die unangepasste junge Unterschicht, die Spaß haben will und sich den Konventionen und Verhaltenserwartungen der Leistungsgesellschaft verweigert.

    Die Milieus, die an dieser Stelle nicht inhaltlich beschrieben werden können, liefern neben der sozialen Lage ein detailliertes Bild über die jeweils (milieu)typischen Lebensziele (inkl. der politischen Einstellung), die Lebensstile, die Freizeitaktivitäten und das Mediennutzungsverhalten. Angesichts der Breite und inhaltlichen Ausdifferenzierung der Sozialen Milieus verwundert es, dass für die Beschreibung der Internetnutzer wie auch der Entwicklungsdynamik der Internetnutzung nach wie vor auf rein soziodemografische Kriterien zurückgegriffen wird: üblicherweise auf Alter und Geschlecht in Verbindung mit Bildungsmerkmalen. Bereits zur íBeschreibung' der Internutzer sind diese Daten außerordentlich mager, für eine Analyse der E-Commerce-Nutzer jedoch völlig unzureichend.

    Abbildung 2 Online Nutzung in den Sozialen Milieus

    Eine milieuspezifische Analyse der Online-Nutzer (Grundlage Sigma, SevenOne Interactive) belegt nun überdurchschnittliche Nutzung in den Milieus des íGesellschaftlichen Leitmilieus' und des íModernen Mainstream', eine unterdurchschnittliche Nutzung dagegen in den Milieus der íModernen Unterschicht'. In den beiden Milieus des íTraditionellen Mainstreams' findet Internetnutzung so gut wie gar nicht statt. Wie die nachfolgende Abbildung zeigt, liegen die drei Milieus mit der höchsten Internetnutzung im rechten oberen Feld der Milieulandkarte, weisen also eher 'moderne' Wertorientierungen auf, sind gleichzeitig aber auch bezüglich ihrer Schichtmerkmale eher überdurchschnittlich. Absoluter Spitzenreiter bezüglich der Online-Penetration ist mit 64 Prozent seiner Mitglieder das Moderne Arbeitnehmermilieu. Trotz seiner relativ geringen Bedeutung in der Gesamtbevölkerung (8 Prozent) stellt dieses Milieu fast 20 Prozent aller Internet-Nutzer in Deutschland. Dies entspricht im Vergleich zum Bevölkerungsdurchschnitt einer mehr als doppelt so intensiven Nutzung des Internet innerhalb dieses Milieus. Die zweithöchste Nutzung weist das Postmoderne Milieu, wo auch noch mehr als jeder zweite das Internet nutzt. Auf Platz drei liegt das Intellektuelle Milieu mit einem Anteil von 40 Prozent Internetnutzern. Ist die Online-Nutzung im Hedonistischen Milieu mit 26 Prozent nur knapp unterdurchschnittlich, fällt sie dann jedoch im Konsum-materialistischen Milieu auf 7 Prozent, im Traditionellen Arbeitermilieu sogar auf 5 Prozent ab. Schlusslicht bezüglich der Online-Nutzung ist das Traditionelle Bürgerliche Milieu: Mit rund 9 Millionen Menschen ist dieses das zweitgrößte Milieu, darunter finden sich allerdings lediglich knapp 150.000 Online-User (= 2 %).

    Auch bei der Häufigkeit der Nutzung führt das Moderne Arbeitnehmermilieu: Fast jeder zweite dieses Milieus nutzt das Internet täglich; da weitere 37 Prozent das Medium noch mehrmals in der Woche nutzt, scheint sich das Internet für die Mitglieder dieses Milieus zu einem "Alltagsmedium" entwickelt zu haben. Genutzt wird das Medium vor allem zur Informationssuche über Internet-Suchmaschinen, sowie zum Versenden von E-Mails, was einem für dieses Milieu typischen Pragmatismus entspricht. Obwohl im Etablierten und im Statusorientierten Milieu sich eher durchschnittliche User finden, nutzen doch in beiden Milieus 9 von 10 das Internet mindestens einmal in der Woche, wobei insb. beim Etablierten Milieu vor allem Dienste genutzt werden, die dem beruflichen und materiellen Erfolgsstreben dienlich sind (Dienstleistungen wie Online-Banking und Online-Broking werden überdurchschnittlich häufig genutzt). Im Statusorientierten Milieu wird vor allem das Streben nach Konsumgütern durch eine überdurchschnittliche Kaufneigung im Netz deutlich. Das Intellektuelle Milieu dagegen zeigt ein überdurchschnittliches Interesse an Nachrichten aus Politik, Wirtschaft sowie an kulturellen Veranstaltungen.

    Es können hier nicht alle Milieus und selbst die erwähnten nicht weiter differenziert hinsichtlich bestimmter Nutzungsmerkmale vorgestellt werden (genauere Ausführungen: Schenk, Schmitt-Walter, Wolf, 2001), wichtig scheint jedoch ein Blick auf die Bereitschaft, das Internet zum Kauf von Waren und Dienstleistungen zu nutzen: Insgesamt geben 38 Prozent der Internet-Nutzer (knapp 7 Millionen) an, in den letzten 12 Monaten etwas über das Internet gekauft, bestellt oder gebucht zu haben. Besonders aktive Online-Käufer sind dabei die User aus dem Postmodernen Milieu. Während mehr als jeder zweite Internet-Nutzer aus diesem Milieu E-Commerce genutzt hat, liegt der Anteil bei dem in der Internet-Nutzung führenden Milieu (Modernes Arbeitnehmer-Milieu) bei "nur" 40%. Eher zurückhaltend beim Online-Shopping sind die User aus dem Modernen Bürgerlichen Milieu sowie die Hedonisten. Hier hat nur gut jeder vierte User das Web zum Einkaufen genutzt.

    Durchgehend typisch für den Online-Kauf sind meist Produkte mit geringem Warenwert (unter 50,- DM) und einer hohen Universalität, also Austauschbarkeit der Produkte, was insb. für Bücher zutrifft, die auch mit deutlichem Abstand die Online-Käufe dominieren (61 % der Online-Shopper); auf den Plätzen folgen Software (39 %) und CDs (38%). Zwischen 20 und 30 Prozent der E-Commerce-Nutzer haben Computer / Hardware, Bekleidung sowie Reisetickets und Hotelreservierungen gekauft. Vernachlässigbar scheinen bislang dagegen Online-Käufe von Lebensmitteln, Schmuck und Uhren oder Körperpflege- und Kosmetikartikeln.

    Diese nackten Zahlen verdecken jedoch teilweise erhebliche und aussagekräftige Milieuunterschiede: So kaufen beispielsweise Angehörige des Etablierten Milieus überdurchschnittlich häufig Konzertkarten, Zeitschriften und Bücher oder nehmen Hotelreservierungen vor. Passend zum starken Interesse dieses Milieus an kulturellen Inhalten und einem damit kompatiblen exklusiven Lebensstandard finden dagegen eher entertainment-orientierte Produkte (Videos, Computer-Spiele, Sportartikel oder Spielzeug) hier nur wenige Abnehmer. Im Unterschied hierzu werden im Statusorientierten Milieu eifrig Auto-Zubehör und Sportartikel gekauft, Hedonisten bestellen überdurchschnittlich häufig Körperpflegeprodukte und Computerspiele.

     

    Abbildung 3 E-Commerce Nutzung in den Sozialen Milieus

    Die Vorzüge einer milieuspezifischen Analyse lassen sich bei einem Vergleich der beiden Milieus, die sowohl das Internet als auch E-Commerce am häufigsten nutzen, also von Modernem Arbeitnehmer- und Postmodernem Milieu sehr schön illustrieren: Zwar zeigt sich zunächst, dass im Postmodernen Milieu der Anteil der User, die schon online eingekauft haben, am höchsten ist, doch eifriger und experimentierfreudiger sind die Shopper aus dem Modernen Arbeitnehmermilieu, dem Pionier-Milieu der Online-Nutzung. Die größere Heterogenität dieses Milieus im Einkaufsverhalten zeigt sich darin, dass nicht nur Bücher, CDs und Software - beide Milieus bewegen sich hier sogar nur im Durchschnitt - sondern mit Zeitungen und Zeitschriften, Telekommunikationsprodukten oder Kleidung und Schuhe, Sport- und Geschenkartikeln Produkte weit überdurchschnittlich gekauft werden, die vom Postmodernem Milieu allesamt weit unterdurchschnittlich bestellt werden. Während beide Milieus sozidemografisch nur geringe Unterschiede aufweisen, haben die differierenden Wertorientierungen nachhaltigen Einfluss auf Lebensziel und -stil, auf Freizeitaktivitäten und eben auch auf das Online-Kaufverhalten. Die größere auf Erlebnis abstellende Außenorientierung des Postmodernen Milieus bedingt zum einen eine geringere Ausbildung und Entwicklung der technischen Kompetenz, zum anderen aber auch das Bedürfnis nach kommunikations- und unterhaltungsorientiertem Einkaufen - beides Gründe für die Postmodernen etwa Kleidung, Sport- und Geschenkartikel im Laden und eben nicht online zu kaufen. So geben denn auch diejenigen Internet-User aus dem Postmodernen Milieu, die bislang noch nicht online gekauft haben, vor allem Usability-Barrieren an: Ihnen ist das Einkaufen im Web schlicht zu umständlich. Aber auch die gewünschte Ware im Web zu finden, stellt sich für dieses Milieu häufiger als Problem dar. Im Unterschied zum Postmodernen weist dagegen das Moderne Arbeitnehmermilieu einen außerordentlich pragmatischen und technisch wie einstellungsmäßig unkomplizierten Umgang mit dem in den Alltag integrierten Medium Internet auf, was sich auch im Online-Kaufverhalten niederschlägt. Auch die Angabe der Kreditkartennummer ist für dieses Milieu - ähnliches gilt auch für das Etablierte Milieu - weitgehend unproblematisch; die Postmodernen wollen dagegen Produkte erst dann zahlen, wenn sie sie auch "in den Händen" halten und für gut befunden haben. Radikal unterscheiden sie sich hier auch von den Hedonisten, die überdurchschnittlich oft bereits im Voraus die bestellten Waren bezahlen, worin sich deren spontane, zwanglose und teils unkontrollierter Umgang mit dem Netz, vor allem aber auch mit Konsum widerspiegelt. Allerdings sind den Hedonisten der Online-Kauf meist noch zu wenig komfortabel, das Online-Warenangebot noch zu klein und die Lieferzeiten zu lang; sie wollen das Gekaufte am liebsten sofort in Händen halten - die Verzögerung der Gratifikation ist für sie unbefriedigend.

    Zusammengefasst zeigt sich, dass eine milieubezogene Erfassung von Internet-Nutzern eine ergiebige Alternative zu bisherigen Zielgruppenauswertungen, die überwiegend auf soziodemographischen Merkmalen beruhen, liefert. Es handelt sich hier um ein Segmentationssystem, dass sich vergleichsweise nahe an der subjektiven Wirklichkeit der Verbraucher orientiert und dass die soziokulturelle Identität des Einzelnen und von Gruppen umfassend auszuleuchten versucht; da es sich damit als geeignet erweist, die jeweils relevanten Motive und Verhaltensweisen zu finden und zu beschreiben, erlaubt eine Übertragung dieses Instruments auf die Online- / E-Commerce-Nutzung eine differenzierte und der auseinanderstrebenden Lebenswelt der verschiedenen gesellschaftlichen Gruppen angemessene Analyse und Entwicklungsprognose.

     

    Literaturangaben

    Ascheberg, C., J. Ueltzhöffer (1999): Transnationales Zielgruppenmarketing. Die Methode der Sozialen Milieus. Mannheim.

    Hartmann, P. (1999): Lebensstilforschung - Darstellung, Kritik und Weiterentwicklung, Opladen.

    Hradil, S. (1990): Alte Begriffe und neue Strukturen - Die Milieu-, Subkultur- und Lebensstilforschung der 80er Jahre, in: Vaskovics, L. (Hrsg.): Subkulturen und Subkulturkonzepte, Opladen.

    Schenk, M., Schmitt-Walter, N, Wolf, M. (2001): Internet und E-Commerce Nutzung in den sozialen Milieus, in: Jahrbuch für Telekommunikation und Gesellschaft 2001 (im Druck).

    SevenOne Interactive (2001): Unveröffentlichtes Datenmaterial zur Internet- und E-Commerce Nutzung in den Sozialen Milieus.

    Vester, M. et al. (1993): Soziale Milieus im gesellschaftlichen Strukturwandel, Köln.

     

    [Prof. Dr. M. Schenk, Dipl.-oec Malthe Wolf, Dr. Thomas Döbler, Forschungsstelle für Medienwirtschaft und Kommunikationsforschung, Universität Hohenheim, 70593 Stuttgart, e-mail: doebler@uni-hohenheim.de.]

    [Wie danken an dieser Stelle SevenOne Ineractive ausdrücklich für die großzügige Zurverfügungstellung ihrer Daten.]


    Yom, Miriam ; Institution: eResult GmbH – eCommerce Research & Consulting, Göttingen
    Article preliminary article (version: 25/06/2002 - 07:47, size: 14208)
    view preliminary article - edit preliminary article - upload an image(for authors only)
    "Wirkungen von Orientierungshilfen auf das Shoppingverhalten und Shoppingerleben bei Webnovizen."