• Aktualisierte Forenregeln

    Eine kleine Änderung hat es im Bereich Forenregeln unter Abschnitt 2 gegeben, wo wir nun explizit darauf verweisen, dass Forenkommentare in unserer Heftrubrik Leserbriefe landen können.

    Forenregeln


    Vielen Dank
  • Kritk / Fragen / Anregungen zu Artikeln

    Wenn ihr Kritik, Fragen oder Anregungen zu unseren Artikeln habt, dann könnt ihr diese nun in das entsprechende Forum packen. Vor allem Fehler in Artikeln gehören da rein, damit sie dort besser gesehen und bearbeitet werden können.

    Bitte beachtet dort den Eingangspost, der vorgibt, wie der Thread zu benutzen ist: Danke!

Spieletest - Treasure Island

AW:

Burtchen am 04.04.2008 12:42 schrieb:
Bonkic am 04.04.2008 11:51 schrieb:
Burtchen am 03.04.2008 23:18 schrieb:
So war das "Punkt" nicht gemeint ;)

Zu Jack Keane: Hab' die Tabelle gerade nicht daheim, aber nur die zweite Hälfte dürfte auf 87+ Punkte kommen. Nur das vierte Fünftel auf einen knappen 90er =)

das bedeutet also, dass ein titel der durchgängig "sehr gut", aber nur halb so lang wäre, in der endabrechnung eine höhere bewertung bekäme, als jk (bspw), das zwar doppelt so lang ist, aber aus einen "sehr guten" und einem nur "durchschnittlichen" teil besteht (vorausgesetzt hierbei sei, dass beide teile gleich umfangreich sind).

müsste ja so sein, wenn man den schnitt der teilwertungen nimmt, oder?
Richtig. Der Umfang spielt für den numerischen Wert keine Rolle.


hmm, das ist doch ein bisschen paradox oder nicht?
alleine diese eine feststellung stellt doch das system der teilwertungen komplett in frage. :-o
 
AW:

Burtchen am 04.04.2008 01:05 schrieb:
Wenn Adventures einen schweren Stand bei uns hätten, würden wir dann so etwas machen?
Schon so gut wie gekauft.
Sind da eigentlich auch mal ausführliche Tests von eXperience und Penumbra drin?
[q=Burtchen]
Fahrenheit liebe ich bekanntermaßen. Und das Problem ist: Trotzdem hat Thomas Recht. Dieses Spiel baut am Anfang so genial viel Atmosphäre und Charakterbildung auf - und zerfetzt diese dann einfach im zweiten Teil. Ein völlig unerklärlicher Story-Sprung nach dem Rummelplatz, eine nun wirklich unglaubwürdige Wendung, auf einmal dieser ganze Esoterik-Kram - das kann man zwar tolerieren, so wie man sich einreden kann, der Kratzer am Autolack passe eigentlich gut.[/quote]
Eigentlich ist doch schon im Intro klar dass man keinen "normalen" Krimi erwarten kann.
Da wunder ich mich immer wieder warum das Ende als Bruch verstanden wird. Natürlich ist der Schnitt hart, aber im Grunde nicht wirklich unerwartet wie so gerne behauptet.
[q=Burtchen]
Ernsthaft: Fahrenheit ist mutig und verdient von mir aus tausende Innovationspreise - aber keinen 80er. [/quote]
Vielleicht solltet ihr eine Art Geheimtippaward o.Ä. vergeben.
Afaik gab es ja in einem älteren Jahresrückblick(2003 oder 2004?!) mal sowas wie eine Liste mit Perlen die nicht unbedingt Top-Wertungen erhielten.
Wäre mal wieder Zeit.
Mit den Klassikern gibt es jetzt zwar sowas in der Art, aber es ist ja nicht so dass es nicht auch aktuelle Perlen neben dem Mainstream gibt.

Bonkic schrieb:
gamestar vergibt 81% und kritisiert witzigerweise gerade die grafik
Ging mir bei der Demo ähnlich.
Technisch war das gerade im Vergleich mit älteren Adventures kaum fest zu machen aber irgend was fühlte sich an der Präsentation nicht richtig an
 
AW:

Bonkic am 04.04.2008 12:45 schrieb:
Burtchen am 04.04.2008 12:42 schrieb:
Richtig. Der Umfang spielt für den numerischen Wert keine Rolle.
hmm, das ist doch ein bisschen paradox oder nicht?
alleine diese eine feststellung stellt doch das system der teilwertungen komplett in frage. :-o
Ich persönlich bin im Kino lieber 80 Minuten gut als 135 Minuten mittelprächtig unterhalten - und sehe das bei Spielen ähnlich. Wenn ein Spiel die Zeit unnötig streckt und mich zwischendurch langweilt, ist es für mich im Mittel weniger unterhaltsam als ein Produkt, dass auf diese Mittel verzichtet.
 
AW:

Bonkic am 04.04.2008 12:45 schrieb:
Burtchen am 04.04.2008 12:42 schrieb:
Bonkic am 04.04.2008 11:51 schrieb:
Burtchen am 03.04.2008 23:18 schrieb:
So war das "Punkt" nicht gemeint ;)

Zu Jack Keane: Hab' die Tabelle gerade nicht daheim, aber nur die zweite Hälfte dürfte auf 87+ Punkte kommen. Nur das vierte Fünftel auf einen knappen 90er =)

das bedeutet also, dass ein titel der durchgängig "sehr gut", aber nur halb so lang wäre, in der endabrechnung eine höhere bewertung bekäme, als jk (bspw), das zwar doppelt so lang ist, aber aus einen "sehr guten" und einem nur "durchschnittlichen" teil besteht (vorausgesetzt hierbei sei, dass beide teile gleich umfangreich sind).

müsste ja so sein, wenn man den schnitt der teilwertungen nimmt, oder?
Richtig. Der Umfang spielt für den numerischen Wert keine Rolle.


hmm, das ist doch ein bisschen paradox oder nicht?
alleine diese eine feststellung stellt doch das system der teilwertungen komplett in frage. :-o

Sehe ich auch so. Ein Spiel von 5 Stunden Spielzeit mit vollen 5 Stunden prächtiger Unterhaltung wird höher bewertet als ein Spiel von 10 Stunden Spielzeit, das 5 Stunden prächtige Unterhaltung bietet und 5 Stunden Standardunterhaltung.
Bei mir is das Gefühl nach dem Spiel entscheidend. Wurde man von dem Spiel "gefangen genommen" und hat seine Umwelt kurze Zeit vergessen, wie war Story und Atmosphäre, wie die technische Präsentation.
Genauso ist es wie mit einem guten Film. Das Gesamtpaket muss stimmen. Es werden Schauspieler, Regie und Drehbuch kritisiert, aber sicherlich nicht Filmminute 15-22 durch den Kakao gezogen.
Sicherlich lässt sich eine Meinung anhand einer detaillierten Motivationskurve mehr untermauern, aber ob die Wertungen nun mehr der Realität entsprechen als noch vor ein paar Jahren würde ich bezweifeln.
 
AW:

Burtchen am 04.04.2008 13:55 schrieb:
Ich persönlich bin im Kino lieber 80 Minuten gut als 135 Minuten mittelprächtig unterhalten - und sehe das bei Spielen ähnlich. Wenn ein Spiel die Zeit unnötig streckt und mich zwischendurch langweilt, ist es für mich im Mittel weniger unterhaltsam als ein Produkt, dass auf diese Mittel verzichtet.


kann ich so pauschal von mir nicht behaupten.
oftmals ist es durchaus der fall, dass der herausragende teil eines ansonsten durchschnittlichen filmes das gesamte besser dastehen lässt, als es die isolierte betrachtung einzelner abschnitte, vermuten lassen würde.

um bei spielen, und jetzt mal konkret bei fahrenheit, zu bleiben; der erste grandiose teil kann von dem folgenden schwächeren überhaupt nicht mehr zerstört werden.
der eindruck bleibt.
und im endergebnis ist fahrenheit -für mich- eben nicht der mittelwert der beiden teile, sondern mehr bzw "besser". :)

ist aber, zugegebenermassen, ein schwieriges thema.
alles dreht sich doch letztendlich um die frage, ob man eine grösse wie "spass" in eine zahl pressen kann.
 
AW:

Bonkic am 04.04.2008 14:19 schrieb:
ist aber, zugegebenermassen, ein schwieriges thema.
alles dreht sich doch letztendlich um die frage, ob man eine grösse wie "spass" in eine zahl pressen kann.


Das kann man eben nicht und deswegen bin ich auch dafür die Zahlen Wertungen abzuschaffen. Mir persönlich reicht der Fließtext und ein gutes Fazit.
Aber ich glaube das einzige Magazin in Deutschland die sowas durchzieht ist die Gee.
 
AW:

BlackDead am 04.04.2008 14:30 schrieb:
Bonkic am 04.04.2008 14:19 schrieb:
ist aber, zugegebenermassen, ein schwieriges thema.
alles dreht sich doch letztendlich um die frage, ob man eine grösse wie "spass" in eine zahl pressen kann.


Das kann man eben nicht und deswegen bin ich auch dafür die Zahlen Wertungen abzuschaffen. Mir persönlich reicht der Fließtext und ein gutes Fazit.
Aber ich glaube das einzige Magazin in Deutschland die sowas durchzieht ist die Gee.
Die Powerplay hat es auch ohne einen einzelnen Endwert versucht.
Nur "versucht" deshalb, weil sie sich auf dem Markt nicht durchsetzen konnte.
Da wird man sich bei den ehemaligen Konkurenz jetzt um so mehr hüten den gleichen "Fehler" zu machen.
 
AW:

olstyle am 04.04.2008 14:43 schrieb:
Die Powerplay hat es auch ohne einen einzelnen Endwert versucht.
Nur "versucht" deshalb, weil sie sich auf dem Markt nicht durchsetzen konnte.
Da wird man sich bei den ehemaligen Konkurenz jetzt um so mehr hüten den gleichen "Fehler" zu machen.

ich wage zu bezweifeln, dass die pcpowerplay wegen ihres wertungssystems gescheitert ist.
da dürften andere dinge eine rolle gespielt haben.

allerdings ist es, wie burtchen ja schon bemerkte, vermutlich schlicht nicht machbar, dass 3 oder gar mehr redakteure ein- und dasselbe spiel lange genug antesten, um eine wertung abgeben zu können.
 
AW:

Bonkic am 04.04.2008 14:50 schrieb:
allerdings ist es, wie burtchen ja schon bemerkte, vermutlich schlicht nicht machbar, dass 3 oder gar mehr redakteure ein- und dasselbe spiel lange genug antesten, um eine wertung abgeben zu können.
Also schmeißt man einfach die Wertungen der verschiedenen Redakteure von mehreren Magazinen zusammen und bekommt folgendes ;) :
http://www.pcgamesdatabase.de/

Sicher ist PCPP nicht ausschließlich aufgrund des Bewertungssystems gescheitert, aber leichter hat das den Markteinstieg sicher auch nicht gemacht.

EDIt: Wörterbuch auf dem Laptop noch nicht installiert...
 
AW:

Möchte – mit etwas Verspätung – noch einige Sachen zur MK sagen. Ich kann (aus Sicht der Redaktion) schon ein wenig verstehen, dass PCG die Wertungsdetails nicht alle veröffentlichen würde. Immerhin bietet man damit unglaublich viel Angriffsfläche für Kritik. Aber anders kann so ein Wertungssystem auch irgendwie nicht funktionieren. Als Leser hat man extrem wenig davon, wenn der Tester irgendwelche Punkte vergibt und dabei Gründe und Details dazu gar nicht bekannt sind.

Auch grobe Wertungsmaßstäbe der MK sind bislang eher in Gesprächen mit der Redaktion hier im Forum im Nebensatz gefallen, wie etwa die Aussage zur Spiellänge und Hardwareanforderung, welche nicht in Wertung / „Benotung“ einfließen. Dabei sind ja gerade die beiden Punkte Sachen, die man wunderbar messen / bewerten kann (Im Vergleich dazu, ob ein Level nun 8 von 10 oder nur 7 von 10 Punkten „Spaß“ gemacht hat). Klar ist es schöner ein Game zu haben, welches einen 10 Stunden fesselt, als einen 40 Stunden-Langeweile-Epos. Aber dazwischen gibt es doch noch so viele Abstufungsmöglichkeiten. Dann fesselt ein Game eben nur 10 Stunden, bietet aber noch zusätzlich 5 bis 10 Stunden sehr gute Unterhaltung. Für den gleichen Preis wie der 10-Stunden-Titel doch nicht wirklich schlecht.

Um die Motivations-/Bewertungskurven verstehen zu können brauchen die Leser daher zumindest mal grobe Infos, was zählt bei der Bewertung, was nicht und nach welchen (groben) Kriterien die Tester bewerten. Da muss es ja eh einen Wertungsmaßstab in der PCG geben, damit nicht jeder einfach „frei nach Schnauze“ Teilwertungen abgibt. (Den Eindruck hat man nämlich aktuell.)

Ich hatte es ja im ersten Beitrag von mir in diesem Thread schon angesprochen: Viele Spiel werden nicht unbedingt in der finalen Fassung getestet und da versprechen Entwickler / Publisher ja fast immer noch, dass sich was verbessert. Mir geht es jetzt gar nicht mal darum, ob dies immer eintritt, sondern wie man sich als Leser überhaupt vorstellen soll, wie der Tester bei so einem Test Teilwertungen vergibt. Immerhin geht es ja darum jede Stunde / jede Mission, etc. eine Einzelwertung zu vergeben, wie viel „Spaß“ man hat. Aber wie darf man sich da vorstellen wird der Spielspaß bewertet, wenn dieser durch etwa Bugs oder KI-Fehler getrübt wird und der Entwickler verspricht da wird sich noch was ändern?

Mag ja sein, dass durch die Bewertung über die MK die Games nun im Schnitt ein etwa weniger bekommen (etwa öfters mal ein 78/79 statt 82/83), nur wird damit das eigentliche Probleme – manche Spiele werden „härter“ bewertet – als andere nicht gelöst. Zu dem hier genannten Tressure Island möchte ich den scheinbaren RTS-Krampf War Leaders in den Raum werfen. (Mir ist schon klar, dass es sich um zwei sehr unterschiedliche Games handelt, aber an Hand dieser unterschiedlichen Games sieht man sehr gut, wie unterschiedliche die Wertungsmaßstäbe ausfallen.)
Tressure Island hat 67% bekommen, wobei sich die Kritikpunkte mit
* Zeitsprünge
* leichte Rätsel -> kurze Spielzeit
* lahme Dialoge
Doch stark in Grenzen halten. Immerhin hat der Titel wohl sehr viele Stärken
* herausragend hübsche 3D-Grafik
* Stimmungsvolle Piratenkulissen
* Sprecher leisten sich keine Fehler
* Steuerung mit allem Komfort
Und auch das Fazit
Grafik: brillant. Sound: kein einziger schwacher Sprecher. Atmosphäre: einwandfrei. Dialoge dagegen: belanglos und vieeel zu lange. Rätsel: bis auf Ausnahmen logisch, aber für Profi s ein Klacks. Umfang: entsprechend mager.
fällt nicht schlecht aus.
Für Nicht-Profis, die ein wenig zu lange Dialoge in Kauf nehmen können, also eigentlich ein brauchbares Spiel. Würde ich jetzt zumindest so entnehmen.

Ein War Leaders hat dagegen zwar nur 10% weniger bekommen, aber abgesehen von „vielen Spielmöglichkeiten“ und „großer Umfang“ gibt es nichts positives. Ganz im Gegenteil, in allen Bereich sind eklatante Mängel vorhanden
* Abstürze
* Probleme mit Balancing
* Probleme im Spielablauf
* Unkomfortable Bedienung
* Dürftige KI
* u.v.m.
Und auch das Fazit ist mehr als eindeutig:
Wer nicht als Betatester enden will: Finger weg. [….]Derzeit ist das Spiel schlichtweg indiskutabel.
Trotzdem reicht es für eine Bewertung von knapp 60% oder – um es mit der Motivationskurve auszudrücken – es wurde fast durchgehend immer 6 von 10 Spielspaßpunkten vergeben.
6 von 10 für eine „Zumutung“, ein „schlichtweg indiskutables Spiel“? (Anmerkung: 6 Punkte werden als „befriedigend“ in der Motivationskurve aufgeführt!)

Egal ob man jetzt die MK vor sich hat oder nicht, wie soll man bei solchen scheinbaren Lust-und-Laune-Teilwertungen das Konzept der MK verstehen? Da kann man doch nur mit dem Kopf schütteln und ohne einige grundlegende Erklärungen, Aussagen und Kriterien zur MK ist die doch so absolut unbrauchbar. Gerade auch weil es unverständlich ist, dass markante Gameplayschwächen, wie etwa einer bescheidene Steuerung, dürfte KI und Balancingprobleme im Vergleich zu etwa lahmen Dialogen / Konzentration auf eher Gelegenheitsspieler (-> leichte Rätsel) so minimale Auswirkungen haben. Es ist zwar nicht ganz so lächerlich wie bei der Gamestar, wo etwa ein Spiel mit unbrauchbarer Steuerung noch immer 90% bekommen kann, aber es stimmen die Verhältnisse nicht.

Ein Paradebeispiel wäre auch Resident Evil 4, welches in der von PCG getesteten Fassung optisch eine Frechheit sondergleichen war und PC-Spieler, die mit Maus & Tastatur spielen wollten, mit einem Krampf konfrontierten. Während man sicherlich darüber streiten kann, ob es nicht besser fürs Spiel ist, wenn auch PCler mit dem PC zocken, statt eine Maussteuerung zu bekommen (Wodurch das Balancing überhaupt nicht mehr stimmen würde), so sind sich eigentliche alle (Sprich: Spieler und auch der „Tester“ im Heft) einig, dass die Atmosphäre massiv unter der Präsentation leidet. Ein Spiel, welches komplett auf Lichtquellen verzichtet, ist eben auch keine Freude und fast schon einzigartig. Wenn so etwas dann auch noch einem Horror-Survival-Game unterläuft, dann ist es eigentlich ein KO-Kriterium. Trotzdem wurde der Titel mit knapp 80% versehen. Was ist das für eine Relation? Die Umsetzung ist in der Hinsicht eine Frechheit sondergleichen und ein Spielspaßkiller hoch 10. Wie kann das Game da im Schnitt „gut“(2) sein?

Man kann und wird sich immer über Kleinigkeiten streiten, wie etwa 84 vs 86%, etc. oder ob Level X nun 8 oder 7 Spielspaßpunkte verdient. Aber solche Sachen sind eben subjektiv und gerade daher fände ich unterschiedliche Wertungen von verschiedenen Redakteuren sehr viel hilfreicher als 50 oder mehr subjektive und zu 95% unbegründete Teilwertungen von einem Tester.

Auch ist es immer wieder interessant, wenn man ein Game gespielt hat, dies mit der MK zu vergleichen. Gerade wenn Punkte „erklärt“ werden, dann stimme ich doch öfters mit der Aussage überein. Nur leider sind solche Punkte meist lediglich Teilwertungen zu einer Gameplaypassage. Ein wunderbares Beispiel, wo ich in Teilen zustimme, aber bei den „unkommentierten Passagen“ wie der Ochs vor der MK stehe, wäre der Call of Duty 4-Test. Zitat aus der MK „Konstant gut | Bis auf den moralischen Einbruch in der ersten Hälfte gibt es keine Durchhänger“. Es ist natürlich alles subjektiv, aber wenn man schon jede Level / jede Passage / jede Stunde, etc. Teilwertungen von 0 bis 10 vergibt, dann darf man dies auch in alle Richtungen nutzen. Abgesehen vom „moralischen Level“ (Den ich zudem als überaus langweilig empfand) gibt es durchgehend immer nur eine 9ner Wertung. Kein Einbruch bei einem kurzen Spiel, welches auch noch Level recycelt und dort lediglich ödes hin- und hergerenne bietet? Die unglaublich atmosphärische und abwechslungsreiche „Schleichmission“ sticht nicht hervor? Für solche Schwankungen bietet sich die MK doch wunderbar an.

Wenn man aber als Spieler, der das Spiel nicht kennt, wenig aus der Kurve sehen kann, die Maßstäbe unklar sind, Kriterien scheinbar schwanken und wenn man das Game kennt, aber trotzdem das Spiel nicht in der Kurve „erkennt“, dann wird vielleicht ein wenig zu viel Arbeit und Mühe in umfangreiche Excel-Tabellen verwendet und zu wenig in ein möglichst transparentes Wertungssystem. Irgendwie wird zu viel Energie dafür verwendet Spielspaß messen zu wollen, wobei so manch messbare / „handlichere“ Faktoren wenig(er) berücksichtigt oder gar ausgegrenzt werden.



Burtchen am 02.04.2008 10:08 schrieb:
Ich mache das immer möglichst genau,
Danke für die Info.


Burtchen am 02.04.2008 10:08 schrieb:
Mich würde trotzdem mal eine vollständige Kurve mit allen Wertungen und Begründungen interessieren. […]
Die Idee finde ich spannend. […]Hättest du eine Vorstellung, wie man das auch im Heft gescheit machen könnte?
Ich denke mal es würde schon viel bringen, wenn einfach mal ein wenig die Wertungsgrundsätze für die Teilwertungen von 0 bis 10 genannt werden. Was wird berücksichtigt, was nicht. Wie werden Abstürze, KI-Fehler und unfertige Versionen „verrechnet“. Wie stark haben KO-Kriterien, wie etwa eine unbrauchbare Steuerung, einen Einfluss? (Etwa bei jeder Bewertung oder nur in den ersten 1-2 Stunden, bis der Tester "vermutet", dass man sich ein wenig daran gewöhnt hat.)
Sicherlich auch interessant ist die Frage, wie etwa Umfang, Ausstattung (etwa ein zusätzlicher Editor), Preis und Hardwareskalierung in die Wertung einfließen.
Man könnte dazu ja mal ein kleines Special mit unterschiedlichen Beispielen bringen, um dem Leser ein wenig zu zeigen, wie (vielleicht auch unterschiedlich) die einzelnen Redakteure Bewerten und wie stark die Teilwertungen am Ende Einzelwertungen einer Person sind bzw. wie viel „Kommunikation“ zwischen den Redakteuren besteht. Etwa, ob man sich mit Kollegen X, der das Game auch gespielt hat, noch einmal zusammen setzt, um Teilwertungen zu diskutieren. Wie ist es etwa, wenn zwei Redakteure das Game zocken, wer bewertet oder bewerten beide?
In den nachfolgenden Hefte könne man davon dann eine Kurzfassung / Kriterienliste zu den bislang schon vorhandenen Infos „So wertet PCGames“ einfügen und auf die „Langfassung“ / Special im Heft bzw. die Onlineversion auf www.pcgames.de verweisen.


Bonkic am 04.04.2008 14:50 schrieb:
vermutlich schlicht nicht machbar, dass 3 [...] redakteure ein- und dasselbe spiel ...
So etwas ist natürlich vom Arbeitsaufwand her gigantisch. Allerdings wird ja für umfangreiche MKs auch einiges an Zeit verbraten (aufschreiben, in die DB eintragen, etc.) und die Zeit wäre IMO besser genutzt sich a) länger mit dem eigentlichen Spiel oder b) mit einem Spiel des Kollegen zu befassen, um dort etwas mehr Zeit- oder Drittmeinung in die finale Wertung zu bringen.

Edit: Knapper als knapp. 10905 Zeichen :B
 
AW:

In der Hoffnung, dass vielleicht jemand aus der Redaktion, den Text gelesen hat / liest, möchte ich noch eine kurze Anmerkung machen und dabei ein weiteres Spiel in dem Raum werfen, woran IMO doch sehr gut zu sehen ist, dass die Wertungsfindung über die Motivationskurve zumindest für den Leser nicht immer wirklich nachvollziehbar ist.

Die Rede ist von So Blond (Test in 05/08). Wie auch bei Tressure Island, so handelt es sich um ein klassisches Point & Klick-Adventure. Ebenfalls sehr gut für einen Vergleich sind die Wertungen. Beide Spiele haben knapp unter 70 bekommen. (So Blond hat 68 und Tressure Island hat 67%).

Beide Games Adventures, beide Spiele haben (fast) die gleiche Wertung, aber die Mängel sind sehr unterschiedlich…

Wie schon im langen Beitrag weiter oben geschrieben, so werden an Tressure Island lediglich die zu leichten Rätsel (und damit die zu kurze Spielzeit) und längere Dialoge bemängelt. Der Rest (Optik, Sprachausgabe, Bedienung, etc. ist „Top“). Schaut man sich nun So Blond an, dann macht das Spiel als Adventure in Adventure-Bereichen unglaublich viel falsch:
# unfaire Rätsel
# zu viele Hotspots
# Überfülltes Inventar
# platter Humor
# lange / viele Laufwege
# Ladezeiten
# zu kleine / versteckte Hotspots
Dazu dann noch Sachen, die in die Negativliste nicht mehr passten, wie
# klobige, ausdruckslose Charaktere
# teils lange / anstrengende Dialoge
# der Tester brauchte – auf Grund der Rätsel – eine Lösung zum Durchspielen
Und auch das Fazit spricht nicht gerade fürs Spiel:
[…]ich steh auf alle Frau’n. Nur nicht auf diese.
Gerade im Vergleich dieser zwei Spiele aus einem Genre wird nicht wirklich erkenntlich, welche Maßstäbe nun für die Bewertung angelegt werden.

Um es kurz zu sagen: Ein Spiel mit unfairen(!) Rätseln bekommt (Den Rest der Mängel in So Blond mal ausgeblendet) eine bessere Wertung als ein „Einsteiger-Adventure“? Wenn der Tester eine Lösung braucht, dann verteilt man noch immer 5-6 Spaßpunkte? Wie soll man da als Leser das Wertungssystem via MK verstehen?
 
AW:

Nali_WarCow am 09.04.2008 15:21 schrieb:
Um es kurz zu sagen: Ein Spiel mit unfairen(!) Rätseln bekommt (Den Rest der Mängel in So Blond mal ausgeblendet) eine bessere Wertung als ein „Einsteiger-Adventure“? Wenn der Tester eine Lösung braucht, dann verteilt man noch immer 5-6 Spaßpunkte?
Und dabei waren doch bei den 10 größten Adventure-Sünden unlogische Rätsel noch der Spielspasskiller Nr. 1!

SSA
 
AW:

Nali_WarCow am 09.04.2008 15:21 schrieb:
Wie soll man da als Leser das Wertungssystem via MK verstehen?


gar nicht.
und deshalb bin ich mir auch beinahe sicher, dass sich kein mensch wirklich für die kurve interessiert.
vermutlich wissen viele noch nicht mal, dass die endwertung darauf basiert.

das wäre mal ein thema für eine umfrage. :]
 
AW:

Bonkic am 09.04.2008 15:43 schrieb:
vermutlich wissen viele noch nicht mal, dass die endwertung darauf basiert.

das wäre mal ein thema für eine umfrage. :]
Mutwilliges Ignorieren unserer Test-Startseite... wir können ja animierte Pinguine neben jede Motivationskurve packen :B

Ganz im Ernst: Nalis Kommentar etc. schau' ich mir mal nach der aktuellen Produktion an, sonst hab' ich wirklich nicht die Zeit, angemessen zu antworten. Wer vom Platzaufwand vertretbare Ideen für eine bessere Integration der Motivationskurve hat: Her damit ;) .

Eine Idee, die ich bei Universe at War aufgreifen wollte, war eine Fünfteilung der Motivationskurve in die entsprechenden Abschnitte, die dann mit einem entsprechenden Kommentar versehen sind, also:

1. Prolog: Beginnt dramatisch und führt die Hierarchie als Bedrohung gut ein, könnte aber abwechslungsreicher sein. Durchschnittswertung: 79, gespielt 40 Minuten.

2. Hierarchiekampagne...

Das könnte man entsprechend auflisten und summieren, hat aber IMHO den Nachteil, dass kleinere Schwächen (die 17te und 32te Mission von C&C3...) herauszuarbeiten auch nicht ganz ohne ist. Aber: Was würdet ihr davon halten?

Anmerkung: Missionszahlen und Wertungen waren jetzt nur beispielhaft.
 
AW:

Finger Weg! Die Grafik ist gut aber nicht Top
und der Rest wirklich mäßig. Die Darsteller
wirken in die Story hineingepresst ohne an der
"Atmosphäre" teilzuhaben welche ich eh fast
gänzlich vermisst habe, die Quests sind
einfach nur viel zu leicht und die Spieldauer
beträgt max. 5 Stunden. Also es läuft ohne
DVD und es gibt Videotheken... aber es lohnt
eigentlich nicht, ausserdem hat es mit Patch
immer noch Grafikfehler (im Dschungel den
falschen Weg laufen und es kommt ein Blau
weisser Bildschirm und neuladen aber auch
so...).

Adventures immer! aber bitte auch mit Liebe in
jeder Masche und nicht so...
 
AW:

Nali_WarCow am 08.04.2008 12:52 schrieb:
Ich kann (aus Sicht der Redaktion) schon ein wenig verstehen, dass PCG die Wertungsdetails nicht alle veröffentlichen würde. Immerhin bietet man damit unglaublich viel Angriffsfläche für Kritik. Aber anders kann so ein Wertungssystem auch irgendwie nicht funktionieren. Als Leser hat man extrem wenig davon, wenn der Tester irgendwelche Punkte vergibt und dabei Gründe und Details dazu gar nicht bekannt sind.
Im Print-Bereich sind da natürliche Funktionalitätsgrenzen gegeben. Ich versuche in meinen Tests eigentlich immer, Einklinker und nummerierte Bilder zu nehmen, bis alles komplett voll ist. Je nach Platz und/oder Artikelgestaltung ergibt es sich aber mitunter so, dass denoch einige "Geisterlinien" drin sind, also Schwankungen, die weder im Text noch en passant erklärt werden (können).
Auch grobe Wertungsmaßstäbe der MK sind bislang eher in Gesprächen mit der Redaktion hier im Forum im Nebensatz gefallen
Kann ich nicht feststellen. Auf der Test-Startseite wird ja erklärt, was für die Motvationskurve von Bedeutung ist. Es fehlt tatsächlich, was nicht in die Benotung einfließt. Das nehme ich mal in unsere Liste auf :]
Um die Motivations-/Bewertungskurven verstehen zu können brauchen die Leser daher zumindest mal grobe Infos, was zählt bei der Bewertung, was nicht und nach welchen (groben) Kriterien die Tester bewerten. Da muss es ja eh einen Wertungsmaßstab in der PCG geben, damit nicht jeder einfach „frei nach Schnauze“ Teilwertungen abgibt. (Den Eindruck hat man nämlich aktuell.)
Bewertungen sind subjektiv. Wir haben eine Skala von 0 bis 10, auf der tatsächlich recht frei bewertet wird. Der Gedankengang der Motivationskurve ist, dass der "Sich um 82 oder 85 streiten"-Faktor nachlässt, wenn man auf einer gröberen Skala urteilt (weil die Frage, ob 8 oder 9, eher konsensfähig ist) und danach mittelt.
Ich hatte es ja im ersten Beitrag von mir in diesem Thread schon angesprochen: Viele Spiel werden nicht unbedingt in der finalen Fassung getestet und da versprechen Entwickler / Publisher ja fast immer noch, dass sich was verbessert. Mir geht es jetzt gar nicht mal darum, ob dies immer eintritt, sondern wie man sich als Leser überhaupt vorstellen soll, wie der Tester bei so einem Test Teilwertungen vergibt. Immerhin geht es ja darum jede Stunde / jede Mission, etc. eine Einzelwertung zu vergeben, wie viel „Spaß“ man hat. Aber wie darf man sich da vorstellen wird der Spielspaß bewertet, wenn dieser durch etwa Bugs oder KI-Fehler getrübt wird und der Entwickler verspricht da wird sich noch was ändern?
Zwei Rechtschreibfehler in den Quest-Texten, 1 Absturz auf 25 Stunden Spielzeit = der gesunde Menschenverstand sagt, das wird was.

Alle 10 Minuten ein Absturz, übles Balancing, keine Rückmeldung auf Anfragen = finster, finster.

Letztlich bleibt uns da nichts Anderes übrig, als mit unserer Erfahrung abzuwägen. Die Alternative, nur Retail-Versionen zu testen, ist nicht konkurrenzfähig.

Burtchen am 02.04.2008 10:08 schrieb:
Mich würde trotzdem mal eine vollständige Kurve mit allen Wertungen und Begründungen interessieren. […]
Die Idee finde ich spannend. […]Hättest du eine Vorstellung, wie man das auch im Heft gescheit machen könnte?
Ich denke mal es würde schon viel bringen, wenn einfach mal ein wenig die Wertungsgrundsätze für die Teilwertungen von 0 bis 10 genannt werden. Was wird berücksichtigt, was nicht. Wie werden Abstürze, KI-Fehler und unfertige Versionen „verrechnet“. Wie stark haben KO-Kriterien, wie etwa eine unbrauchbare Steuerung, einen Einfluss? (Etwa bei jeder Bewertung oder nur in den ersten 1-2 Stunden, bis der Tester "vermutet", dass man sich ein wenig daran gewöhnt hat.)
Sicherlich auch interessant ist die Frage, wie etwa Umfang, Ausstattung (etwa ein zusätzlicher Editor), Preis und Hardwareskalierung in die Wertung einfließen.
Man könnte dazu ja mal ein kleines Special mit unterschiedlichen Beispielen bringen, um dem Leser ein wenig zu zeigen, wie (vielleicht auch unterschiedlich) die einzelnen Redakteure Bewerten und wie stark die Teilwertungen am Ende Einzelwertungen einer Person sind bzw. wie viel „Kommunikation“ zwischen den Redakteuren besteht. Etwa, ob man sich mit Kollegen X, der das Game auch gespielt hat, noch einmal zusammen setzt, um Teilwertungen zu diskutieren. Wie ist es etwa, wenn zwei Redakteure das Game zocken, wer bewertet oder bewerten beide?
In den nachfolgenden Hefte könne man davon dann eine Kurzfassung / Kriterienliste zu den bislang schon vorhandenen Infos „So wertet PCGames“ einfügen und auf die „Langfassung“ / Special im Heft bzw. die Onlineversion auf www.pcgames.de verweisen.
Bonkic am 04.04.2008 14:50 schrieb:
vermutlich schlicht nicht machbar, dass 3 [...] redakteure ein- und dasselbe spiel ...
So etwas ist natürlich vom Arbeitsaufwand her gigantisch. Allerdings wird ja für umfangreiche MKs auch einiges an Zeit verbraten (aufschreiben, in die DB eintragen, etc.) und die Zeit wäre IMO besser genutzt sich a) länger mit dem eigentlichen Spiel oder b) mit einem Spiel des Kollegen zu befassen, um dort etwas mehr Zeit- oder Drittmeinung in die finale Wertung zu bringen.[/quote]
Der Zeitaufwand der Motivationskurve ist zwar kein geringer, aber definitiv deutlich unter dem "vernünftigen" Spielen mit einem weiteren Kollegen. FÜr mich ergibt es wenig Sinn, wenn jemand, der Anno 1701 ein Stündchen gespielt hat, effektiv dieselbe Mitsprache über die Wertung bekommt wie ich mit meinen 2x Stunden. Und mehrere Redakteure für 4 Arbeitstage abstellen - keine Chance.

Langzeittests und Kontrollbesuche überlegen wir immer wieder, allerdings sind sie rein kapazitär kaum umzusetzen :|
 
Zurück