AW:
Möchte – mit etwas Verspätung – noch einige Sachen zur MK sagen. Ich kann (aus Sicht der Redaktion) schon ein wenig verstehen, dass PCG die Wertungsdetails nicht alle veröffentlichen würde. Immerhin bietet man damit unglaublich viel Angriffsfläche für Kritik. Aber anders kann so ein Wertungssystem auch irgendwie nicht funktionieren. Als Leser hat man extrem wenig davon, wenn der Tester irgendwelche Punkte vergibt und dabei Gründe und Details dazu gar nicht bekannt sind.
Auch grobe Wertungsmaßstäbe der MK sind bislang eher in Gesprächen mit der Redaktion hier im Forum im Nebensatz gefallen, wie etwa die Aussage zur Spiellänge und Hardwareanforderung, welche nicht in Wertung / „Benotung“ einfließen. Dabei sind ja gerade die beiden Punkte Sachen, die man wunderbar messen / bewerten kann (Im Vergleich dazu, ob ein Level nun 8 von 10 oder nur 7 von 10 Punkten „Spaß“ gemacht hat). Klar ist es schöner ein Game zu haben, welches einen 10 Stunden fesselt, als einen 40 Stunden-Langeweile-Epos. Aber dazwischen gibt es doch noch so viele Abstufungsmöglichkeiten. Dann fesselt ein Game eben nur 10 Stunden, bietet aber noch zusätzlich 5 bis 10 Stunden sehr gute Unterhaltung. Für den gleichen Preis wie der 10-Stunden-Titel doch nicht wirklich schlecht.
Um die Motivations-/Bewertungskurven verstehen zu können brauchen die Leser daher zumindest mal grobe Infos, was zählt bei der Bewertung, was nicht und nach welchen (groben) Kriterien die Tester bewerten. Da muss es ja eh einen Wertungsmaßstab in der PCG geben, damit nicht jeder einfach „frei nach Schnauze“ Teilwertungen abgibt. (Den Eindruck hat man nämlich aktuell.)
Ich hatte es ja im ersten Beitrag von mir in diesem Thread schon angesprochen: Viele Spiel werden nicht unbedingt in der finalen Fassung getestet und da versprechen Entwickler / Publisher ja fast immer noch, dass sich was verbessert. Mir geht es jetzt gar nicht mal darum, ob dies immer eintritt, sondern wie man sich als Leser überhaupt vorstellen soll, wie der Tester bei so einem Test Teilwertungen vergibt. Immerhin geht es ja darum jede Stunde / jede Mission, etc. eine Einzelwertung zu vergeben, wie viel „Spaß“ man hat. Aber wie darf man sich da vorstellen wird der Spielspaß bewertet, wenn dieser durch etwa Bugs oder KI-Fehler getrübt wird und der Entwickler verspricht da wird sich noch was ändern?
Mag ja sein, dass durch die Bewertung über die MK die Games nun im Schnitt ein etwa weniger bekommen (etwa öfters mal ein 78/79 statt 82/83), nur wird damit das eigentliche Probleme – manche Spiele werden „härter“ bewertet – als andere nicht gelöst. Zu dem hier genannten
Tressure Island möchte ich den scheinbaren RTS-Krampf
War Leaders in den Raum werfen. (Mir ist schon klar, dass es sich um zwei sehr unterschiedliche Games handelt, aber an Hand dieser unterschiedlichen Games sieht man sehr gut, wie unterschiedliche die Wertungsmaßstäbe ausfallen.)
Tressure Island hat 67% bekommen, wobei sich die Kritikpunkte mit
* Zeitsprünge
* leichte Rätsel -> kurze Spielzeit
* lahme Dialoge
Doch stark in Grenzen halten. Immerhin hat der Titel wohl sehr viele Stärken
* herausragend hübsche 3D-Grafik
* Stimmungsvolle Piratenkulissen
* Sprecher leisten sich keine Fehler
* Steuerung mit allem Komfort
Und auch das Fazit
Grafik: brillant. Sound: kein einziger schwacher Sprecher. Atmosphäre: einwandfrei. Dialoge dagegen: belanglos und vieeel zu lange. Rätsel: bis auf Ausnahmen logisch, aber für Profi s ein Klacks. Umfang: entsprechend mager.
fällt nicht schlecht aus.
Für Nicht-Profis, die ein wenig zu lange Dialoge in Kauf nehmen können, also eigentlich ein brauchbares Spiel. Würde ich jetzt zumindest so entnehmen.
Ein War Leaders hat dagegen zwar nur 10% weniger bekommen, aber abgesehen von „vielen Spielmöglichkeiten“ und „großer Umfang“ gibt es nichts positives. Ganz im Gegenteil, in allen Bereich sind eklatante Mängel vorhanden
* Abstürze
* Probleme mit Balancing
* Probleme im Spielablauf
* Unkomfortable Bedienung
* Dürftige KI
* u.v.m.
Und auch das Fazit ist mehr als eindeutig:
Wer nicht als Betatester enden will: Finger weg. [….]Derzeit ist das Spiel schlichtweg indiskutabel.
Trotzdem reicht es für eine Bewertung von knapp 60% oder – um es mit der Motivationskurve auszudrücken – es wurde fast durchgehend immer 6 von 10 Spielspaßpunkten vergeben.
6 von 10 für eine „Zumutung“, ein „schlichtweg indiskutables Spiel“? (Anmerkung: 6 Punkte werden als „befriedigend“ in der Motivationskurve aufgeführt!)
Egal ob man jetzt die MK vor sich hat oder nicht, wie soll man bei solchen scheinbaren Lust-und-Laune-Teilwertungen das Konzept der MK verstehen? Da kann man doch nur mit dem Kopf schütteln und ohne einige grundlegende Erklärungen, Aussagen und Kriterien zur MK ist die doch so absolut unbrauchbar. Gerade auch weil es unverständlich ist, dass markante Gameplayschwächen, wie etwa einer bescheidene Steuerung, dürfte KI und Balancingprobleme im Vergleich zu etwa lahmen Dialogen / Konzentration auf eher Gelegenheitsspieler (-> leichte Rätsel) so minimale Auswirkungen haben. Es ist zwar nicht ganz so lächerlich wie bei der Gamestar, wo etwa ein Spiel mit unbrauchbarer Steuerung noch immer 90% bekommen kann, aber es stimmen die Verhältnisse nicht.
Ein Paradebeispiel wäre auch Resident Evil 4, welches in der von PCG getesteten Fassung optisch eine Frechheit sondergleichen war und PC-Spieler, die mit Maus & Tastatur spielen wollten, mit einem Krampf konfrontierten. Während man sicherlich darüber streiten kann, ob es nicht besser fürs Spiel ist, wenn auch PCler mit dem PC zocken, statt eine Maussteuerung zu bekommen (Wodurch das Balancing überhaupt nicht mehr stimmen würde), so sind sich eigentliche alle (Sprich: Spieler und auch der „Tester“ im Heft) einig, dass die Atmosphäre massiv unter der Präsentation leidet. Ein Spiel, welches komplett auf Lichtquellen verzichtet, ist eben auch keine Freude und fast schon einzigartig. Wenn so etwas dann auch noch einem Horror-Survival-Game unterläuft, dann ist es eigentlich ein KO-Kriterium. Trotzdem wurde der Titel mit knapp 80% versehen. Was ist das für eine Relation? Die Umsetzung ist in der Hinsicht eine Frechheit sondergleichen und ein Spielspaßkiller hoch 10. Wie kann das Game da im Schnitt „gut“(2) sein?
Man kann und wird sich immer über Kleinigkeiten streiten, wie etwa 84 vs 86%, etc. oder ob Level X nun 8 oder 7 Spielspaßpunkte verdient. Aber solche Sachen sind eben subjektiv und gerade daher fände ich unterschiedliche Wertungen von verschiedenen Redakteuren sehr viel hilfreicher als 50 oder mehr subjektive und zu 95% unbegründete Teilwertungen von einem Tester.
Auch ist es immer wieder interessant, wenn man ein Game gespielt hat, dies mit der MK zu vergleichen. Gerade wenn Punkte „erklärt“ werden, dann stimme ich doch öfters mit der Aussage überein. Nur leider sind solche Punkte meist lediglich Teilwertungen zu einer Gameplaypassage. Ein wunderbares Beispiel, wo ich in Teilen zustimme, aber bei den „unkommentierten Passagen“ wie der Ochs vor der MK stehe, wäre der Call of Duty 4-Test. Zitat aus der MK „Konstant gut | Bis auf den moralischen Einbruch in der ersten Hälfte gibt es keine Durchhänger“. Es ist natürlich alles subjektiv, aber wenn man schon jede Level / jede Passage / jede Stunde, etc. Teilwertungen von 0 bis 10 vergibt, dann darf man dies auch in alle Richtungen nutzen. Abgesehen vom „moralischen Level“ (Den ich zudem als überaus langweilig empfand) gibt es durchgehend immer nur eine 9ner Wertung. Kein Einbruch bei einem kurzen Spiel, welches auch noch Level recycelt und dort lediglich ödes hin- und hergerenne bietet? Die unglaublich atmosphärische und abwechslungsreiche „Schleichmission“ sticht nicht hervor? Für solche Schwankungen bietet sich die MK doch wunderbar an.
Wenn man aber als Spieler, der das Spiel nicht kennt, wenig aus der Kurve sehen kann, die Maßstäbe unklar sind, Kriterien scheinbar schwanken und wenn man das Game kennt, aber trotzdem das Spiel nicht in der Kurve „erkennt“, dann wird vielleicht ein wenig zu viel Arbeit und Mühe in umfangreiche Excel-Tabellen verwendet und zu wenig in ein möglichst transparentes Wertungssystem. Irgendwie wird zu viel Energie dafür verwendet Spielspaß messen zu wollen, wobei so manch messbare / „handlichere“ Faktoren wenig(er) berücksichtigt oder gar ausgegrenzt werden.
Burtchen am 02.04.2008 10:08 schrieb:
Ich mache das immer möglichst genau,
Danke für die Info.
Burtchen am 02.04.2008 10:08 schrieb:
Mich würde trotzdem mal eine vollständige Kurve mit allen Wertungen und Begründungen interessieren. […]
Die Idee finde ich spannend. […]Hättest du eine Vorstellung, wie man das auch im Heft gescheit machen könnte?
Ich denke mal es würde schon viel bringen, wenn einfach mal ein wenig die Wertungsgrundsätze für die Teilwertungen von 0 bis 10 genannt werden. Was wird berücksichtigt, was nicht. Wie werden Abstürze, KI-Fehler und unfertige Versionen „verrechnet“. Wie stark haben KO-Kriterien, wie etwa eine unbrauchbare Steuerung, einen Einfluss? (Etwa bei jeder Bewertung oder nur in den ersten 1-2 Stunden, bis der Tester "vermutet", dass man sich ein wenig daran gewöhnt hat.)
Sicherlich auch interessant ist die Frage, wie etwa Umfang, Ausstattung (etwa ein zusätzlicher Editor), Preis und Hardwareskalierung in die Wertung einfließen.
Man könnte dazu ja mal ein kleines Special mit unterschiedlichen Beispielen bringen, um dem Leser ein wenig zu zeigen, wie (vielleicht auch unterschiedlich) die einzelnen Redakteure Bewerten und wie stark die Teilwertungen am Ende Einzelwertungen einer Person sind bzw. wie viel „Kommunikation“ zwischen den Redakteuren besteht. Etwa, ob man sich mit Kollegen X, der das Game auch gespielt hat, noch einmal zusammen setzt, um Teilwertungen zu diskutieren. Wie ist es etwa, wenn zwei Redakteure das Game zocken, wer bewertet oder bewerten beide?
In den nachfolgenden Hefte könne man davon dann eine Kurzfassung / Kriterienliste zu den bislang schon vorhandenen Infos „So wertet PCGames“ einfügen und auf die „Langfassung“ / Special im Heft bzw. die Onlineversion auf www.pcgames.de verweisen.
Bonkic am 04.04.2008 14:50 schrieb:
vermutlich schlicht nicht machbar, dass 3 [...] redakteure ein- und dasselbe spiel ...
So etwas ist natürlich vom Arbeitsaufwand her gigantisch. Allerdings wird ja für umfangreiche MKs auch einiges an Zeit verbraten (aufschreiben, in die DB eintragen, etc.) und die Zeit wäre IMO besser genutzt sich a) länger mit dem eigentlichen Spiel oder b) mit einem Spiel des Kollegen zu befassen, um dort etwas mehr Zeit- oder Drittmeinung in die finale Wertung zu bringen.
Edit: Knapper als knapp. 10905 Zeichen