Forum

Prognosemodell für Absatzmenge in Abhängigkeit von 3 Variabl

Gesperrt

Seite: 1

Autor Beitrag
Mitglied
Registriert: Apr 2007
Beiträge: 3
Hallo!

Ich habe ein ganz dringendes Problem. Ich schreibe zur Zeit meine Diplomarbeit zum Thema Modellentwicklung zur Potentialbestimmung der nachgelagerten Verwertungsstufe einer Kinoprouktion. Kurz gesagt, ich soll ein Modell entwickeln, dass das DVD-Potential (als Gesamtzahl für das erste Jahr) eines Kinofilms bestimmt. Dabei habe ich bereits mehrere Einflussfaktoren wie Kinoerfolg, DVD-Startpreis und Anzahl an gleichzeitig auf DVD erscheinenden Filmen definiert und mich mit der multiplen Regressionsanalyse beschäftigt. Mir liegen Daten für ca. 600 Filme der letzten 3 Jahre vor, die ich bereits in Genres unterteilt habe. Nun möchte ich gerne für jedes Genre eine Gleichung herleiten, die aus den Angaben Kinobesucher, DVD-Preis und Anzahl Konkurrenten das DVD-Potential bestimmt. Wenn ich mithilfe von Excel eine multiple Regressionsanalyse mit Bestimmung der Regressionskoeffizienten durchführe und die Gleichung dann auf meine vorhandenen Titel anwende, zeigen die ermittelten Potentiale leider meist noch nicht einmal eine annähernde Übereinstimmung mit den tatsächlichen Werte. Ich weiss einfach nicht, wo mein Fehler liegt und auch die bisherige Recherche hat mich nicht weiter gebracht. Es wäre wirklich toll, wenn mir hier jemand einen Tipp geben könnten, wo mein Fehler liegt, oder wie ich ein geeigneteres Prognosemodell erstellen könnte.

Wenn ich das ganze über die Datenanalyse Funktion in Excel mache, liefert es mir folgendes Ergebnis:
AUSGABE: ZUSAMMENFASSUNG

Regressions-Statistik
Multipler Korrelationskoeffizient 0,860349521
Bestimmtheitsmaß 0,740201298
Adjustiertes Bestimmtheitsmaß 0,710978271
Standardfehler 46286,79401
Beobachtungen 55

ANOVA
Freiheitsgrade (df) Quadratsummen (SS) Mittlere Quadratsumme (MS) Prüfgröße (F) F krit
Regression 3 3,17417E+11 1,05806E+11 49,38498814 4,11388E-15
Residue 52 1,11408E+11 2142467300
Gesamt 55 4,28825E+11

Koeffizienten Standardfehler t-Statistik P-Wert Untere 95% Obere 95% Untere 95,0% Obere 95,0%
Schnittpunkt 0 #NV #NV #NV #NV #NV #NV #NV
X Variable 1 0,057670555 0,00808256 7,135183871 3,01232E-09 0,041451711 0,073889398 0,041451711 0,073889398
X Variable 2 1445,066234 1187,538825 1,216858096 0,22915239 -937,9047028 3828,037171 -937,9047028 3828,037171
X Variable 3 179,5726958 879,806048 0,204104866 0,839068276 -1585,887261 1945,032652 -1585,887261 1945,032652



AUSGABE: RESIDUENPLOT

Beobachtung Schätzung für Y Residuen
1 229889,3127 72729,72929
2 162902,1089 134748,9941
3 138079,9917 83358,17527
4 67398,95381 69045,16219
5 23560,54417 99155,32383
6 83901,0598 31035,2702
7 153397,161 -43758,84899
8 60357,45687 48886,13213
9 61682,11048 47445,57752
10 64827,21737 41409,68763
11 94777,0089 6341,395098
12 61332,20171 33208,51829
13 37349,62039 54051,75061
14 33977,30591 44515,26009
15 65392,65954 8409,052458
16 207782,2842 -136403,9352
17 40950,05099 30403,92901
18 51645,85817 18982,53783
19 39615,60007 28374,32293
20 55525,84991 10021,60109
21 50486,11304 12683,73496
22 47499,07909 11502,85491
23 52208,08501 4088,860989
24 101215,2103 -46207,22834
25 94225,70631 -39889,41831
26 133402,1001 -80691,27509
27 37466,88806 13483,79894
28 30058,52506 19638,13694
29 42656,05016 5753,940841
30 39000,42353 9238,589467
31 43711,95555 2437,567449
32 49432,10317 -4794,03317
33 48069,46231 -8971,538312
34 51432,12253 -16047,86553
35 61410,13124 -27324,68924
36 49241,0846 -20765,5176
37 31533,10531 -3462,502313
38 30002,30667 -4152,037675
39 104323,5875 -79427,64954
40 37762,75287 -16517,09387
41 63164,33155 -44086,17855
42 22267,91769 -5492,629685
43 36339,42144 -20658,77944
44 50260,2283 -34826,7923
45 21235,98623 -7950,494229
46 38759,32242 -27087,55242
47 51030,8523 -41538,6473
48 25948,99801 -17204,52801
49 41336,15732 -33875,39132
50 18971,90055 -13014,90155
51 35250,23249 -29484,54849
52 26419,99188 -20670,39488
53 29410,07461 -23920,69561
54 31688,96157 -27507,90657
55 25644,5367 -22445,1667



Grüße,
Schwamm
Mitglied
Registriert: Apr 2004
Beiträge: 7407
Ort: Erfurt
Hi & willkommen im Forum,

Zitat
...und mich mit der multiplen Regressionsanalyse beschäftigt


Das ist vermutlich die richtige Methode.

Zitat
Mir liegen Daten für ca. 600 Filme der letzten 3 Jahre vor, die ich bereits in Genres unterteilt habe. Nun möchte ich gerne für jedes Genre eine Gleichung herleiten, die aus den Angaben Kinobesucher, DVD-Preis und Anzahl Konkurrenten das DVD-Potential bestimmt.


Hmmm... ich vermute, daß es diese Gleichung grundsätzlich gibt, daß aber Deine Vorgehensweise aus zwei Gründen nicht ausreicht:

1. es gibt mit Sicherheit viele weitere EInflußfaktoren, die Du nich operationalisiert hast. Wer geht beispielsweise bei einem so schönen Wetter wie heute ins Kino? Ein Film, der eine Schönwetterperiode "erwischt", läuft anders (vermutlich schwächer) an als einer, der bei Nebel, Dunkelheit und überfrierender Nässe erscheint. Auch die gerade aktuelle Konjunktur, Substitutionsprodukte (Freizeitpark statt Kino), die Jahrefszeit (Weihnachtsmarkt statt Film) und vieles andere mehr müßten eigentlich berücksichtigt werden.

2. die Unterteilung in Genres reicht mE nach nicht, denn selbst bei ähnlichen Filmen dürften noch lange nicht vergleichbare Verhältnisse herrschen.

Das hier wundert mich also nicht:

Zitat
Wenn ich mithilfe von Excel eine multiple Regressionsanalyse mit Bestimmung der Regressionskoeffizienten durchführe und die Gleichung dann auf meine vorhandenen Titel anwende, zeigen die ermittelten Potentiale leider meist noch nicht einmal eine annähernde Übereinstimmung mit den tatsächlichen Werte


Ich würde vermuten, daß nur eine annähernde Preis-Absatz-Beziehung möglich ist, aber alle weitergehenden Prognosen statistische Massage bleiben und keinen Praxisnutzen entfalten können. ich würde vermuten, daß der numerische Aufwand weitaus (!) größer ist als es im Rahmen einer Diplomarbeit möglich ist – wenn überhaupt ein numerisches Modell möglich ist. Menschen entscheiden nach dem Werterwartungsmodell (u.a. Vroom und Yetton, schon ein paar Jahre her), und das ist viel komplexer als es den Kinogängern selbst je bewußt sein dürfte...
Mitglied
Registriert: Apr 2007
Beiträge: 3
Zwischen der Anzahl der Kinobesucher und der letztlich verkauften DVDs besteht grundsätzlich schon eine Korrelation.

Wie könnte ich denn eine mögliche Preis-Absatz Analyse mit dieser Korrelation noch kombinieren, wenn nicht über multiple Regression?
Mitglied
Registriert: Apr 2004
Beiträge: 7407
Ort: Erfurt
Hi,

Zitat
Zwischen der Anzahl der Kinobesucher und der letztlich verkauften DVDs besteht grundsätzlich schon eine Korrelation.


Das bezweifele ich nicht, aber es sind auch viele andere Faktoren, die Du gar nicht alle wissen kannst! Illegale Downloads, neue Technologien, Modetrends - schon als Außenstehender fallen mir eine Unzahl von Einflußfaktoren ein!

Zitat
Wie könnte ich denn eine mögliche Preis-Absatz Analyse mit dieser Korrelation noch kombinieren, wenn nicht über multiple Regression?


Die Regressionsrechnung ist schon an sich die richtige Methode, aber meine Vermutung ist, daß es mit "normalen" Mitteln, also ohne millionenschwere Marktforschung, gar nicht geht (oder keine brauchbaren Ergebnisse herauskommen). Aber wie gesagt, das ist meine Vermutung... die das wirklich wissen, sitzen vielleicht nur in Hollywood, und die werden ihr Wissen kaum an Dritte rauslassen...
Mitglied
Registriert: Apr 2007
Beiträge: 3
Hm. Das is jetzt ein sehr großes Problem für mich... Da dies nun einmal der Hauptteil meiner Diplomarbeit ist. Gibt es denn keine Vereinfachtere Variante, die zumindest zu annäherungsweisen Lösungen führen könnte? Abweichungn bis 30% wären für mich noch akzeptabel. Ich kann gerne auch einmal eine Beispieldatei schicken.
Mitglied
Registriert: Apr 2004
Beiträge: 7407
Ort: Erfurt
Also, mal ein einfaches Beispiel: der Absatz X nach Release eines Medienobjektes i kann als Funktion der Zeit t als Xi = f(t) aufgefaßt werden. Diese Funktion hängt aber von Größen ab, die Du unmöglich operationalisieren kannst. Zum Bleistift: ich bin, wer wüßte das nicht, ein böser Mensch. Ich kaufe Deinen Film, rippe ihn und stelle ihn in alle mir bekannten Tauschbörsen (und ich kenne viele), mehr noch, ich wuchte das ins Usenet. Jetzt laden eine Menge Leute die Datei runter, Dein f(t) ändert sich also. Mehr noch, Du kannst unmöglich wissen, wieviele der Freeloader gekauft hätten, wäre die Datei nicht in der Tauschbörse aufgetaucht, denn das hängt von vielen Dingen wie Verfügbarkeit von DSL oder einfach Lust und zeit und Geld der Leute ab.

Wie willst Du DAS in Zahlen fassen? Ein Ding der Unmöglichkeit, denke ich... Dein Ergebnis sollte sein, daß es eben keine verläßliche Vorhersage gibt... ist meine Meinung!


Gesperrt

Seite: 1

Parse-Zeit: 0.041 s · Memory usage: 1.48 MB · Serverauslastung: 1.79 · Vorlagenbereich: 2 · SQL-Abfragen: 8