A mozi egész biztosan az egyik leginkább túldeterminált technológia, mely az 1890-es évek végén jelent meg a korábbi kulturális gyakorlatok széles tárházából. A médium archeológiájának feltérképezésekor nyomon követhetjük a vetített mozgó képek hosszú történetét, például a laterna magica vetítéseket, melyektől a mozi abban különbözik, hogy fotografikus realista képekkel dolgozik. Vagy, ha a mozi alapját a fotográfiában szeretnénk rögzíteni, a döntő különbség maga a mozgás lesz. Egy másik leszármazási vonal a mozit a színházhoz kapcsolja, ellentétbe állítva az élő színházi jelenlétet a vászon testetlen virtualitásával. E három genealógia, még akkor is, ha különböző kiindulópontokkal szolgál, magától értetődő, és egymást kölcsönösen alátámasztja, mivel mindhárom a film vizuális aspektusára fókuszál.(1) Végtére is, mi más van még ezen kívül?

A mozi kezdeteinek a magyarázatához ebben az írásban egy negyedik kontextust kínálok, olyan kontextust, mely nem annyira nyilvánvaló, sőt, talán egyáltalán nem is kézenfekvő: a hang és a hang reprodukciójának tizenkilencedik századi vizsgálatát. Nem fogok szokásos módon amellett érvelni, hogy a hang a mozgó kép kísérőjeként fontos szerepet töltött be a mozi kezdete óta; inkább amellett érvelek, hogy a hallási kultúra – beleértve a rögzítés módszereit, főként a fonográfot -, valamint a beszéd és az ének eredeteire vonatkozó fogalmak aktívan formálták azt, ahogyan és amilyen korai filmképeket készítettek, és azt is, ahogyan a közönség megtanulta azokat észlelni. Olyan kiemelt esetekben, mint az arc vagy a hang megjelenítésének a középpontba helyezése, a képet a hang pótlékának tekinthetjük, nem pedig fordítva.

Amint a revizionista filmtörténészek gyakran rámutatnak, maga a némafilm fogalma olyan teleologikus téveszme, melyet utólagosan hoztak létre, mivel a némafilmek sohasem voltak némák. Ez a közhely maga is újabb revíziót provokált: Rick Altman megkerülhetetlen tanulmánya, mely a korszak hangi panorámáját [soundscape] térképezi fel, beleértve a színpadi zenét, a vetítéses előadásokat, illusztrált énekeket, vaudeville előadásokat és számos szinkronizációs tervezetet, azt bizonyítja, hogy a hang sokkal változatosabb (és időnként szünetelő) jelenség volt a korai moziban, mint ahogy azt korábban gondolták. (2) Altman az amerikai vetítési gyakorlatra fókuszál, a hangok sokaságára, melyek körülvették a mozgóképek bemutatását, mielőtt a hangosfilm megjelent volna. Mindazonáltal viszonylag keveset beszél a hang vizualizációjáról a korai moziban, ami engem érdekel, vagyis arról, ahogyan a hangnak a mozgókép általi rögzítését, megidézését elképzelték. Ebből a célból három korai filmre koncentrálok; mindegyiket az átmenet kulcsfontosságú időszakaiban készítették: Fred Ott tüsszentése(Edison Kinetoscopic Record of a Sneeze, January 7, 1894) A csók (May Irwin Kiss, 1896) és A nagy nyelés (The Big Swallow, 1901), melyek mindegyike a szájat és a vokalizáció mozgását helyezi előtérbe, miáltal feltűnő audiovizuális hatásokat hoz létre.

Az audiovizualitás mint egységes szakterület maga is érdekes archeológiával rendelkezik. A késő tizenhetedik századtól kezdődően különböző filozófusok, mint John Locke (1689), George Berkeley (1709) és Étienne Bonnot de Condillac (1754) olyan értekezéseket írtak az érzékelésről, melyek az érzékelés konvergenciájáról is elmélkedtek. (3) Denis Diderot például egy híres csembalóba szeretett belé, melynek hangjai különböző színeket hoztak létre (a hangszert Voltaire kigúnyolta). (4) A felvilágosodás episztemológiája ösztönözte az érzékek empirikus vizsgálatát, főként a hallásét és a látásét, egymástól függetlenül és egymás viszonyában is, abból a meggondolásból, hogy egyik érzék segíthet a másik megmagyarázásában. Jonathan Sterne szerint a hangok láthatóvá tétele a tizenkilencedik századi tudósok rögeszméjévé vált. (5) Thomas Young és Ernest Chladni, az akusztika úttörői, olyan eljárásokat alakítottak ki, melyek lehetővé tették a hangrezgés grafikus visszaadását, és így a hangot ténylegesen egyfajta írássá változtatták, bár a fonográf 1877-es feltalálásáig a „tovatűnő” hangokat, ahogy Thomas Edison nevezte őket, nem lehetett tárolni, sem visszajátszani. (6) Az audiovizualitás hibriditására irányuló második kísérlet nem annyira a rögzítési technológián alapult, hanem inkább a két terület közti analógián, mint például Félix Nadarnak az „akusztikus Daguerréotype-ról” szóló elképzelése 1856-ban, mely úgy rögzítené a hangot, mint a kamera a képet. Ez olyan eszköz, melyet 1864-ben „phonographe-nak” nevezett el, egy teljes évtizeddel azelőtt, hogy maga a gép (azonos névvel) ténylegesen megvalósult volna. (7) Nadar lenyűgöző pontosságán túl, mellyel Edison találmányát megjósolta, vagy az ilyen típusú, az érzékek inskripcióján alapuló analógiák gyakoriságán túl, melyek a tizenkilencedik század folyamán folyton felbukkannak, ez a technológiai audiovizualitás azért is szembetűnő, mert az észlelés integrációja az egységes(ített) emberi test modelljét követi.

Nem meglepő tehát, hogy amikor Edison a mozgókép fejlesztése mellett kezdte komolyan elkötelezni magát, 1888 októberében visszaadta a szívességet Nadarnak első és híres szabadalmi bejelentésében [patent caveat] (8) , mégpedig úgy, hogy ő maga is párhuzamot állított fel: „Egy olyan eszközön kísérletezem, mely azt csinálja a Szem számára, amit a fonográf a Fül számára, vagyis a mozgásban lévő dolgok rögzítése és reprodukciója, mégpedig olyan formában, hogy egyszerre legyen olcsó, praktikus és használható.” (9) Edison kezdettől fogva a hangon keresztül csatornázta berendezését – ahelyett, hogy a látás eszközeként fogta volna fel, a kamerához hasonlóan – hozzákapcsolva saját korábbi találmányaihoz. Annak ellenére, hogy a kamera nyilvánvaló modellként szolgált a rögzítés és reprodukció számára, a szabadalmi bejelentés retorikája azt követelte, hogy az új tervezés minél több szempontból egyedülálló legyen. Figyelembe véve azt a kitételt, hogy „olcsó, praktikus és használható” legyen, a tény, hogy Edison nem említi a fotográfiát (szándékos elhallgatás), még inkább árulkodó, hiszen a hordozható Kodak ugyanazon év májusában jelent meg, s biztosan könnyebb volt használni, mint az ő fonográfját. Akkor tehát miért hangsúlyozza a hangot? Kézenfekvőnek tűnik a magyarázat, hogy a tünékeny hangok jobban megfelelnek a „mozgásban lévő dolgoknak”, mint mondjuk a nyugalmi állapotban lévő tárgyaknak, különösen a temporalitásra való utalás által, de mégsem annyira nyilvánvaló. Edison Szem és Fül hasonlata (melyet újra és újra megismételt) nem pusztán laza metafora, főként, ha továbbolvassuk a bejelentést az első mondat után (amit kevesen szoktak megtenni): „Ezt azt apparátust Kinetoszkóp Mozgó Képnek [Kinetoscope Moving View] nevezem. A tényleges mozgás első produkciója, vagyis folyamatos Opera.” (10) Az eszköz nevében és abban, amit az rögzít és reprodukál, az új médium tartalmának legelső említésében Edison érdekes módon nem a rohanó vonatokra vagy a vágtázó lovakra utal, hanem a tizenkilencedik század nagy multimediális látványosságára.

Edison némileg talányos utalása a „folyamatos Operára” távolról sem alkalmi megjegyzés. Ettől a pillanattól kezdve a kinetoszkóp kereskedelmi forgalmazásáig hat év múlva, a rekláminterjúk számtalan sorában, melyet az újságoknak adott az egész országban, Edison folyamatosan hangsúlyozta az apparátus azon képességét, hogy az emberi éneket és beszédet visszaadja: „a szónok száját”, amint az egyik korai cikk (1890) fogalmaz, vagy „az énekes arcának minden kis rezdülését”, ahogyan maga Edison egy másik cikkben (1891) hirdette. (11) Az opera és a szónoklás bizonyos kulturális presztízst kölcsönözhetett az új technológiának, de többről van itt szó. (12) Hónapokkal azelőtt, hogy megtörtént az első szabadalmi bejelentés, 1888-ban Edison találkozott Eadweard Muybridge fotográfussal, aki közös vállalkozást ajánlott, mely által Edison „hozná létre a saját berendezésével a hang [voice] tónusait, míg ő hozzáadná a gesztusokat és az arcjátékot.” (13) Világos, hogy Muybridge számára a fonográf követeli meg a vizuális téma kiválasztását, aki sokkal inkább az állati mozgás megragadására szakosodott, mintsem a politikusok vagy az énekesek szájára. Muybridge megértette, hogy az emberi arc az a hely, ahol a látás és a hang a legerősebben keresztezik egymást. (14)

Hogy mire gondolt Edison, azt részlegesen megmagyarázhatja az eszköz tervében létrehozott változás, ami a mozgókép negyedik szabadalmi bejelentésében jelenik meg 1889 novemberében: „A fogaskerék összekapcsolható a fonográf hajtótengelyével, így létrejön a pozitív kapcsolat, és a lefényképezett személy összes mozdulata pontosan egybeesik az általa kibocsátott hangokkal.” (15) Ennek a „pozitív kapcsolatnak” a hozzáadásával, már nem a Szem és Fül közti analógiáról beszélünk, hanem „összetett mozgás és hang reprodukálóról”, ami egészen más dolog, egy „kettős” gépezet, melyet azért dicsérnek, mivel „a ma használt fonográf tökéletesítése”. (16) A látás és a hang szimultán és egyesített felfogása valójában szembemegy a kettejük közti hasonlósággal, mely különbségüktől függ, és tiszteletben tartja azt. Edison nemcsak egyszerűen új életet akar lehelni előző találmányába (ezt is teszi), mely nem igazán vált be mint zenei szórakoztató eszköz, fontos azt is megjegyezni, hogy a fonográf kezdettől fogva megidézte a vizualitás lehetőségeit, amint a tekintélyes folyóirat, a Scientific Americanszerkesztői megfogalmazták, miután Edison előzetesen megmutatta nekik a gépet 1877-ben: „Már most is lehetséges, hogy leleményes optikai szerkezetek által az emberek sztereoszkópikus fotográfiáit mindenki számára láthatóan a vászonra vetítsék. Adjuk ehhez hozzá a beszélő fonográfot a hang utánzásához – nagyon nehéz lenne a valódi jelenlét illúzióját ennél tovább fokozni.” (17)

A Scientific American úgy tűnik, hogy fején találta a szeget. A fonográf egyik legelső közzétett leírásában a középponti kérdés nem a hang reprodukciójának találmánya, amely végtelenül ismételhetővé teszi azt, hanem „a valódi jelenlét illúziója”, egy olyan jelenlét, melynek alapja a teljes emberi alak. Más szóval az illúziót a hallás és a látás kombinációjával, s nem elkülönítésével lehet fenntartani. Amint Tom Gunning megfogalmazta, Jonathan Crary-t követve, a mozi annak a századnak a legvégén jelent meg, mely fokozatosan annak szentelte magát, hogy „feldarabolja az emberi érzékszerveket annak érdekében, hogy megvizsgáljon és uraljon minden egyes érzékszervet külön-külön”. (18) Ennek a bonyolult történeti folyamatnak az egyik kezdőpontjaként Diderot 1751-es félelmetes gondolatkísérletét idézhetjük: „úgyszólván földarabolni az embert és megvizsgálni, mit nyer az egyes érzékektől, amelyekkel fel van ruházva… Mulatságos lenne összegyűjteni egy olyan társaságot, amelynek minden tagja csak egy érzékkel rendelkezik”. (19) Amint ez a példa is sugallja, az érzékek elkülönítésére vonatkozó egyoldalú történeti fejlődés fogalma kissé félrevezető, hiszen ezek szétválasztásának oka részben az, hogy lássuk, hogyan illeszkednek össze, mint például a fogyatékosok „társasága”, mely Diderot képzeletében megalakul (s melyet talán elnökölni kíván mint filozófus).

Amint a Scientific American előre sejtette, a fonográf és a telefon (1876) új médiuma a beszéd testetlen reprodukciója által azzal fenyegetett, hogy az emberi hangot leválasztja az eredetéről. Ez olyan kettéválás, melyet a kinetoszkóp még újabb médiuma el szeretett volna kerülni a jelenlét illúziójának a visszaállításával, a képpé vált test [imaged body] egyesítésével, még pontosabban a száj és az arc, valamint az elidegenedett beszéd és ének egyesítésével. Mindazonáltal nem egyszerűen arról van szó, hogy az egyik új médium pótolhatja a másik hiányosságát, mivel a mozgóképi technológia kezdettől fogva magában foglalta saját elkülönítő tendenciáit. Sokkal gyümölcsözőbb, ha a látás és a hang médiumait dialektikusként kezeljük, beleértve azt is, hogy néha feszültségben vannak egymással. Innen adódik Edison ragaszkodása ahhoz, hogy berendezése összetett audiovizuális természetű, melyet Edison kollégája, W.K.L. Dickson a hajtótengely „pozitív kapcsolata” (akár a kötőjel) által Kineto-Fonográfnak nevezett, hangsúlyozva „összefoglaló” képességét.(20) Csak egy ilyen, az érzékeket integráló apparátus tudott megfelelni a „folyamatos Operának” – egy tetszetős fogalom, mely Edison részéről a legtalálóbb – átvitt értelmű – közelítés az emberi tapasztalat teljes körű megragadásához, a hanghoz és a mozgáshoz, bármennyire is mesterségesen vannak ezek megvalósítva. (21)

Az érzéki teljesség operai illúziója, melyet Edison reményei szerint találmánya meg tud valósítani, megfelel annak, amit André Bazin filmteoretikus „a totális film mítoszának” nevezett, a tökéletes valószerűség álma, melyet utólag Noel Burch Frankenstein összetákolt szörnyetegéhez hasonló, polgári rémálomként csúfolt ki. (22) George Parsons Lathrop a még kipróbálatlan új technológia reklámozásához és audiovizuális lehetőségeinek megértéséhez egy másik alakzatot használt, mely sem nem utópikus, sem nem rémálomszerű. Lathrop, Edison jövendőbeli munkatársa egy soha be nem fejezett sci-fi románcban 1891-ben a Harper’s Weekly-ben közölt cikkében olyan ötlettel állt elő, mely egy regényíró (talán Mark Twain?) fantáziájának is becsületére vált volna: „Az utolsó képünkön azok az ikerkészülékek láthatóak, melyek készen állnak arra, hogy egymás mellett testvériesen és harmonikusan dolgozzanak, olyan intelligenciával, mely már-már tudatosnak tűnik. Egyetlen elme eredeti és egyedülálló szüleményeként úgy össze vannak kapcsolódva, mint a sziámi Eng és Chang, nem a hús köteléke által, hanem egy acélrúdon keresztül, mely a fonográf hengerét forgató tengelyt (a kép jobb oldalán) a kinetográf zárszerkezetét működtető szerkezettel köti össze, ez utóbbi a kép bal oldalán egy dobozban van elhelyezve.” (23) Lathrop először (majdnem) saját tudatossággal ruházza fel az apparátust, azután elismeri, hogy a gép szelleme valójában zseniális barátjának, Edisonnak „egyetlen elméje”, végül pedig a sziámi ikrekhez hasonlítja. Frankenstein természetellenes Teremtményével szemben ez az ikermetafora nem igazán támasztja alá az eszköz organikusságát (az acélrúd ellenére sem), de felhívja a figyelmet annak szörnyszerűségére. Látás és hang egymás mellé kerülhetnek egy és ugyanazon testben, de az eredmény nem fog szükségképpen jól is mutatni.

Nem csodálkozhatunk tehát azon, hogy amikor el kezdjük megvizsgálni az Edison kinetoszkópjával készült első filmeket, az eredmények kissé nyugtalanítóak, különösen, ami a mozgó emberi száj visszaadását illeti. Nem lenne ésszerű, hogy makacsul ragaszkodjak ahhoz, hogy a korai mozi elsősorban az arcra és a hangra fókuszált, de a fontos filmek meglepő hányada a vokalizáció biomechanikáját próbálja visszaadni. Edison Fred Ott tüsszentése (1894) című filmje az egyik legérdekesebb eset. A filmet filmkocka nagyítások szekvenciájaként közölték a találmányt bejelentő magazinokban a kereskedelmi forgalmazást megelőzően, és sohasem vetítették le nyilvánosan. Mindazonáltal a képei, melyeket kimerítően tárgyaltak a kortársak, a médium néhány törekvésére és lehetőségére is döntő javaslatot tettek. A nagyszabású wagneri opera helyett bohózatot kapunk, a görcsös fej eltorzult grimaszait: „Az eltorzult arc a tüsszentés bohózata”, ahogy egyik kommentátora megfogalmazza. (24)

Linda Williams észrevette a film erotikus implikációit, egyfajta orgazmikus kioldódást, melyet eredetileg egy fiatal lánynak kellett volna előadnia. (25) Az előadni[perform] azonban nem a megfelelő szó, mivel a tüsszentést elő lehet idézni ugyan, de az inkább megtörténik, nem pedig az ember csinálja. Ami itt engem leginkább érdekel, az nem más, mint Ott rohamának automata-jellege, egy olyan testé (deréktól felfelé), fejé és szájé, amelyek fölött az erőszakos mozgásnak kiszolgáltatva nincs ellenőrzése. Ilyen értelemben a tüsszentés komikuma visszaigazolja Henri Bergson jól ismert, 1900-ból származó nevetés-elméletét: „az emberi test mozdulatai olyan mértékben komikusak, amilyen mértékben a test közben egy puszta mechanizmusra emlékeztet bennünket.” (26) Az is kísérteties, ahogyan Ott szemei lecsukódnak, miközben a lélegzet erőteljesen kiáramlik, mintha befelé fordulna a kamera tekintete elől. Kiemelve a bemutatás tudományos értékét, aHarper’s Weekly kommentátora a lefényképezett tüsszentésnek kilenc különböző fázisát elemzi, dicséri „a grimasz és a hang különös skáláját, melyet a kinetoszkóp pontosan lekottázott” – olyan igét használva, melyet általában a zenei lejegyzésre értünk. A folytatásban Edison híres Szem-Fül párhuzamát visszhangozza: „Mint ahogy van részben nem látott, úgy kétségkívül van részben nem hallott is.” (27)

Ez furcsa megjegyzés, főleg ha figyelembe vesszük azt, hogy korábban a cikkben Phillips arról beszélt, hogy „a fonográf mint egy kísérő pontosan kiejti a »hápcit«”. Lévén, hogy a tüsszentés hangja konvencionális, mi is az, amit nem hallunk? A „nem hallott” itt talán úgy működik, mint Keats soraiban: „Édes a hallott dal, de mit a fül / Meg sem hall, még szebb” (Tóth Árpád ford. „Heard melodies are sweet, but those unheard / Are sweeter”), vagyis a képzelet erejét hirdeti az érzékek felett. Ilyen módon Ott tüsszentése lehetővé teszi Edisonnak, hogy kibújjon a fogadalma alól azzal, hogy a mozgó képet egy nagyon ismerős és automatikus hanggal párosítja, melyet le lehet együtt játszani, ha audiovizuális kereskedelmi modelljét a fonográfot és a kinetoszkópot bemutató üzletével sikerre tudná vinni, de akkor is érthető (a szavakkal ellentétben), ha a zaj pusztán csak képzeletben jön ki Ott látható szájából. (28)Ha Ott mondott volna valamit, az jelenthetett volna bármit, de a tüsszentés az tüsszentés az tüsszentés. Az egyik oka annak, hogy nem ütközik különösebb nehézségbe a hang felidézése, az, hogy az eltorzult arcmozgás és annak akusztikus megfelelője ugyanazon fiziológiai forrás által vannak előidézve, csípőben összeforrva, mint Eng és Chang esetében. A test, nem pedig az apparátus hozza létre a szinkronizációt.

Zajnak nevezem, és nem hangnak azt, amit Ott kibocsát, mivel bizonyos értelemben a tüsszentés a beszédtől a lehető legtávolabb áll. David Appelbaum filozófus egy rendkívüli elmélkedésében arra tesz kísérletet, hogy az emberi hangnak visszaadja a testet azáltal, hogy eltávolodik a beszédtől mint puszta értelemtől, és előtérbe állítja az emberi megnyilatkozás zsigeri, affektív, intim és proprioceptív (mozgást érzékelő) aspektusait. Appelbaum kifogásolja azt a feltételezést, hogy az emberi hang pusztán csak a gondolat átlátszó artikulációjának az eszköze volna. Például szembeállítja a beszédet a köhögéssel, melyet a test „írásjelének” nevez, „a hang görcsös kibocsátásának”, „indulatszónak”, mely félbeszakítja a kommunikációt, és megzavarja a filozofikus elmét, mely elfojtja a testi tapasztalat sokkját az ideális igazság kedvéért. Amint bölcsen megjegyzi: „Az igazság nem más, mint a végső, köhögés elleni szirup.”(29) A tüsszentést (melyet röviden említ) még ennél is hatékonyabb kihívásnak gondolom az értelem számára, mint a megtestesült visszhangokat, köhögéseket, kurjantásokat, melyeket elemez, mivel – amint fentebb is utaltam rá – szeszélyes automatizmusa a test mélyéről fakad, és nem lehet színlelni vagy akaratlagosan előidézni. Ebben az értelemben kevésbé emberi hang, mint a köhögés (és minden bizonnyal a beszéd), mely feltehetőleg az állati léthez visz közelebb bennünket, mintsem Bergson gépfogalmához.

A teológusok és a filozófusok évszázadok óta méricskélik az emberek és az állatok közti határvonalat, és változatlanul a nyelvet és annak eredetét hívják segítségül, hogy az emberinek a területét körülhatárolják. A beszéd, gesztus és hang kialakulására vonatkozó elmélkedések gyakran a szem és a fül laza hasonlatára alapoztak (Edison szíves engedelmével), mindazonáltal Jonathan Ree alapvető meglátása szerint „a látás és a hallás közti különbségeknek nem sok közük van a beszédet a gesztikus kommunikációhoz fűző kapcsolatokhoz”. (30) Francis Bacon (1605), miközben a természetben kereste a nyelv gyökereit, a testi gesztusokat „átmeneti hieroglifákhoz” hasonlította, olyan tovatűnő látható jelekhez, melyek egykoron a beszéddel és az írással voltak egyenértékűek, megelőzve azokat.(31) A primitív emberek mint élő hieroglifák tetszetős fogalma, kiknek mozgásban lévő teste olvasásra volt szánva, több mint egy századon keresztül tartotta magát, amikoris Condillac és Diderot az 1740-es, 1750-es években a testet az ősi költészet forrásának gondolta el. Condillac például a táncot tételezte a nyelv eredeteként kavargó és vibráló mozdulatok formájában, melyek lehetővé tették az érzelmek sokaságának egyidejű kifejezését. A fejlődés következő fázisában Condillac szerint ezek a sürgető gesztusok artikulált hangokhoz kapcsolódtak, és elvezettek a kommunikatív beszédhez, mely által konvencionalizált egyértelműségre tettek szert, de veszítettek szenvedélyes (és költői) közvetlenségükből és intenzitásukból. Amint barátja, Rousseau megfigyelte, Condillac testi „mozdulatnyelvének” elmélete körben forgó, és nem válaszolja meg azt a paradox kérdést, hogy a beszédhez vezető nyelv előtti gesztusok már előfeltételezik a társadalmi érintkezés meglétét. (32)

A tizenkilencedik század közepére a nyelv eredetének a vizsgálatában a biológia lényegesebb volt a spekulatív pszichológiánál. Az ember származásában (1871) Darwin például azt állította, hogy az emberi beszéd az állatok párzási hangjaira vezethető vissza, vitatva Herbert Spencer korábbi feltevését, miszerint a szenvedélyes beszéd a zenéből eredeztethető. (33) Wilhelm Wundt a század vége felé kezdte kidolgozni nagyigényű elméletét, mely összekapcsolta a gondolkodást, az érzelmeket és a testi tapasztalatokat a gesztus jelrendszerében – a tágabban vett fiziológiai pszichológia részterületeként, összefogva az evolúciós elméletet a kulturális antropológiával, a fiziológiával és a nyelvészettel. (34)Wundt szerint a nyelv érzelmi állapotok sorából fejlődött ki, melyek olyan veleszületett kifejező cselekvések alapjául szolgálnak, amelyeket megpróbált a legpontosabban kodifikálni és osztályozni, amit egyik követője „a kifejezés pszichofizikájának” nevezett. (35) Darwinnal ellentétben, aki Az ember és az állat érzelmeinek kifejezése (1872) című munkájában amellett érvelt, hogy töretlen kontinuitás van a természeti világ és az emberi világ között, (36) Wundt az emberi jelölő gyakorlatot különállónak gondolta. A test grammatikáját és szintaxisát akarta meghatározni szemben a puszta pantomimmal, és fejezeteken át elemezte, hogy bizonyos kézmozdulatok vagy arckifejezések mit jelentenek a különböző primitív és modern kultúrákban. A korai film „folyamatos operája” abbeli különös törekvéseiben, hogy újraegyesítse a látást és a hangot, a szájat és az emberi hangot, még ha akaratlanul is, de ugyanezeket a vitás pontokat ismételgette a beszéd és a nyelv eredetéről, különösen a gesztus elsődlegességéről mint a kommunikáció alapjáról.

A gesztusnyelv mellett érvelve Wundt hosszasan elemzi a süketséget és a süketnémák jelölő gyakorlatát. Bacontől Leibnizig, William Jamestől Wittgensteinig tulajdonképpen a süketség olyan alapkő maradt, melyen ki lehetett próbálni a gondolat és a nyelv közti viszonyra vonatkozó különböző javaslatokat. James úgy gondolta, hogy az emberek szavak nélkül gondolkodnak, bár nem pontosan értette hogyan, és a süketnéma Melville Ballard önéletrajzi emlékiratait idézte; ezt a spekulációt később Wittgenstein megkérdőjelezte. (37) Két századdal korábban Diderot ugyanezen kérdéseken töpreng, a Levél a süketekről és némákról (1751) című szövegében egy „elméleti némát” feltételez, és azt találgatja, hogyan lehetne beszélgetni vele a gesztusok által, melyekről Diderot azt gondolja, hogy természetes szintaxissal rendelkeznek. (38)Praktikusabb nézőpontból vizsgálva a süketnémák nevelése az 1700-as évektől kezdve válik középponti problémává, melynek eredményeképpen több mint egy évszázadon keresztül kétfajta pedagógiai stratégia versenyzik egymással. Az egyik megközelítés ragaszkodik ahhoz, hogy a süketnémák tanuljanak meg beszélni. Alexander Graham Bell apja például bevezeti a „Látható Beszédet” (még egy audiovizuális találmány), azt a módszert, mely egy olyan ábécét dolgozott ki, amelyben az emberi hangszálak által kiejtett hangokat az arc palatáblája alapján lehet létrehozni, melyre a beszéd ráíródik. A másik megközelítés elvontabb módon a jelezés fejlesztésére koncentrált, a fizikai gesztusok teljes nyelvére, mely kizárólag látható volt, és egyáltalán nem próbálta a beszédet utánozni. Egy 1880-as milánói konferencián jeles pedagógusok betiltották a jelnyelv tanítását Bell Látható Beszédének és más hasonló, a fonetikai átíráson alapuló rendszereknek a javára és az elkövetkező évtizedek süketnémáinak a kárára. (39)

A szájhang mellett kardoskodók fölénye a kézi jelezőkkel szemben oda vezetett, hogy a süket oktatás egyre inkább a vokalizáció részleteire koncentrált – és itt jön be újra a korai film. 1891-1892 között, pontosan, amikor egymás után készítették az interjúkat Edisonnal a kinetoszkópnak arra vonatkozó lehetőségeiről, hogy megragadja a szónokok és operaénekesek részletes arckifejezéseit, Georges Demeny Franciaországban elkezdte alkalmazni saját fejlesztésű mozgóképi technológiáját annak céljából, hogy segítse a süketeket a szájról olvasásban. A fonoszkóp ismerős analógiára támaszkodott („a fiziognómia kifejezése úgy lesz bemutatva, ahogy a fonográf megőrzi a hangot”), és süket tanulók számára lejátszotta önmaga közelképét, amint eltúlzott artikulációval ismétli a „Je vous aime” és a „Vive la France!” mondatokat. (40) Félretéve (egy kevés ideig) ezen mondatok érdekes tartalmát, az ösztönzés a kísérletezéshez két forrásból adódhatott Demeny számára. Étienne-Jules Marey közeli munkatársaként Demeny úgy tekintett saját próbálkozására, mint ami vizuálisan összetevő alkotó elemeire tagolja a beszéd aktusát; ez szűkebben értelmezett részfeladata Marey laboratóriumi kísérleteinek, melyek a mozgás elemzését és kimerevítését célozták a kronofotográfiával. Kevésbé tudományos értelemben Demény érdeklődését az arc és a száj mozdulatai iránt Ottomar Anschütz 1890 januárjában Berlinben kiállított „beszélő portréi” is inspirálhatták: arisztokrata polgárok közeli felvételei, melyeket egyfajta családi albumnak szántak a szórakoztatás céljából. (41)

Demeny kalandozása a süketek oktatásának a területére azonban kudarcot vallott, amint ő maga is elismerte: „A kísérlet nem volt teljesen sikeres, mivel a kiejtett mondat nem volt teljes egészében lefényképezve; félbeszakadt tudtunk nélkül. A süketnéma azonnal felismerte, őt nem a mondat általános értelme vezette, ami lehetővé tette volna számára, hogy kitalálja a kimaradt részeket is.” (42) A kronofotográfia tökéletlenségét hibáztatja a kudarcért, nem a fonoszkópot vagy magának a kísérletnek a tervét. „A mondat általános értelmére” tett utalás azonban hallgatólagosan visszaigazolja Ferdinand de Saussure szkeptikus megjegyzését (melyet meglehet, épp Demeny vonatkozásában fogalmazott meg), miszerint „a beszédaktusokat [parole] lehetetlenség minden részletükben lefényképezni; a legkisebb szó kiejtése is számtalan izommozgást képvisel, amelyeket rendkívül nehéz megismerni és [grafikusan] ábrázolni.” (43) Saussure számára a beszéd rögzítése nemcsak hogy nem praktikus, hanem teljesen irreleváns a nyelvészet szempontjából, mivelhogy ő a jelentés általános szerkezetét részesíti előnyben. Saussure felfogásában a nyelv (langue) elemzése nem a fonetikára, hanem a fonémákra támaszkodik, a megkülönböztető egységek konvencionalizált rendszerére, nem pedig a szájból kibocsátott zajokra.

Edisonnak, Demenynek, Anschütz-nek és másoknak a hang vizualizálására tett kísérletei viszonylag rövid életűek voltak, mivel a filmkészítők felismerték, amit Vachel Lindsay évekkel később megfogalmazott: „A mozgó tárgyak, s nem a mozgó ajkak képezik a mozgókép szavait.” (44) Mivel a hangszinkronizáció bizonytalan volt, a filmek inkább a mozgásban lévő testet emelték ki magának a mozgásnak a kedvéért, olyan témákra fókuszálva mint az akrobaták, az ökölvívók és vívómesterek, bár még ezekben az esetekben is fellelhetjük az eleven arc iránti megszállottságot mint a tényleges jelenlét illúziójának az alapját: „a szem gyors mozgása, a száj megfeszülése, a kitágult orrlyukak és a nehéz, mély légzés a benne rejlő lehetőségeket bizonyítják”. (45) 1895-ben, amikor a Lumière-testvérek kereskedelmi forgalomba bocsátották a vetített mozgóképet, W.K.L. Dickson még mindig a „Kineto-Fonográfról” beszélt, Edison pedig azt ismételgette, hogy az ő gépezete a Metropolitan Opera művészeinek életnagyságú arcjátékait fogja rögzíteni, és jóval a művészek halála után is képes lesz azokat bemutatni. Az újságok szintén az „Opera az otthonunkban” elképzelést hangoztatták mint olyan „élő valóságot”, ami hamarosan megvalósul. (46)

Valójában a nagyméretű vetítés bevezetése, szemben Edison kukucskáló dobozával, segített újraéleszteni a beszéd visszaadására vonatkozó megszállottságot, legalábbis egy fontos esetben. Ugyanabban az évben, amikor az első amerikai vetítőgép bemutatkozott New Yorkban a Koster & Bial’s Music Hallban 1896. április 23-án, Edison elkészítette cégének az évben legnépszerűbb filmjét,A csókot. Kikövetkeztethető, hogy ez a 15 másodperces film eredetileg a vitaszkóp bemutatkozására készült, de egy héttel elhalasztották a bemutatását. (47) A tény, hogy A csók a vitaszkóp számára készült, döntő fontosságú annak megértésében, hogy miért keltett akkora szenzációt, ami a vetítés új technológiájához kapcsolódó két jellegzetességnek volt köszönhető: az egyik az emberi test felnagyítása, különösen az arcé és a szájé, a másik a kollektív bemutatása a nézők százai előtt. Az ilyen vaudeville helyszínek egyenesen bátorították a heves csoportos megnyilvánulást, annak kezdetét, amit Miriam Hansen úgy írt le, mint a korai mozi ellenközönségének kialakulását. (48)

A csók első nyilvános „bemutatása” valójában nem a vásznon történt, hanem az újságban. Hogy felkeltse az érdeklődést a vitaszkóp iránt, a New York Worldelhívta Mary Irwint és John C. Rice-t Edison Black Maria nevű stúdiójába, hogy pózoljanak a kamera előtt, melyet az újság még mindig kinetoszkópnak nevezett. Arra kérték, hogy adják elő a The Widow Jones, egy zenei bohózat utolsó felvonását, melyben az 1895 szeptemberében kezdődő, előző évadban szerepeltek New Yorkban. Bár énekre számíthatnánk, a musical újrajátszott tetőpontja néhány sor dialógusból állt, melyet egy hosszan kitartott, feltűnő csók követett. A World vasárnapi melléklete (1896. árpilis 26.) megjelentetett majdnem egy egész oldalas hirdetést a filmezésről, a valóságos újsághírnek azt a címet adták: Egy csók anatómiája (The Anatomy of a Kiss). A címet részletes leírás követte, beleértve négy oszlopnyi „pillantást” [„winks”], vagyis fotografikus képkockákat az oldal közepén (ami teljesen szokatlan volt az újságban abban az időben), valamint négy nagyobb, az oldal négy sarkában elhelyezett tollrajzot, amelyek a tetőpontot megelőző gesztusok szekvenciáját mutatták be (bajuszpedrés, tétovázás, ölelkezés). Az újságíró (Mrs. McGuirk) azt hangoztatta, hogy „amit a kamera nem látott a csókban, az nem is volt ott” – úgy látszik, tudta, mikor kell abbahagyni, és inkább a filmezésre fókuszált, mint magára a csókra, amely „túl sugárzó volt, hogy jelzőkkel le lehessen írni”, mint ahogy az utolsó felirat beharangozta. A Fred Ott tüsszentéséhez hasonlóan, az újságíró egyfajta tréfás leírást ad a kinetoszkóp tudományos értékéről, ahogyan az a pár arcjátékát pillanatokra szabdalja az időben, s azt a következtetést vonja le, hogy „A csók hatszáz különböző fázisa keveset hagy a képzeletre.” (49)

Bármennyire is meglepő volt az újságbeszámoló szót és képet egyesítő elrendezése, mégsem tudta felvenni a versenyt magának a filmnek ezt követő bemutatásával. De a színházi verzió sem tudott versenyezni vele, legalábbis ennek a túlfűtött pillanatnak a visszaadásával. Musser rámutatott arra, hogy a korai mozi vásznának testetlen virtualitása hogyan tette lehetővé a nézők számára bizonyos típusú látványosságok élvezetét, mint például a passiójátékok vagy a bokszmérkőzések, melyek egyébként tiltottak voltak a túlságosan is testi jellegük miatt. (50) A csók esetében amellett érvelek talán nem nyilvánvaló módon, hogy ez a virtualitás a mozgókép vetítése és az emberi test felnagyítása miatt sokkal hangsúlyosabbá vált. Ez a filmnek az az aspektusa, amely a legerőteljesebb kollektív választ váltotta ki, amint a korabeli megjegyzések is tanúsítják: „A kinetoszkópban egyszerre egy személy tud bekukucskálni, és egy pici mozgóképet lát, míg a vitaszkópban a kép vásznon van bemutatva, és életnagyságban ragyog, úgy, hogy az egész közönség látja a képet egyszerre… A képek élethű valóságossága egyesek szerint megdöbbentő … Arcaik [Irwiné és Rice-é] változó kifejezései, kecses mozdulataik, a kéz, az ajak és a szem játéka hibátlanul van visszaadva.” (51)

Egyenlőségjelet téve az életnagyságú és az élethű között, az író „a kéz, az ajak és a szem játékát” dicséri, ami bármennyire is testetlen szemben az élő színházzal, úgy tűnik, hogy jobban hasonlít a közönség soraiban ülő nézők eleven arcához. A nagyméretű képek, főleg a fej közelképei, önmaguk felismerését kínálták a nézők számára. Az ilyen típusú, a korai mozira jellemző azonosulást a testi hasonlóság váltotta ki, s nem azok a pszichikai mechanizmusok, melyeket a 70-es években az apparátuselméletek kidolgoztak a hollywoodi filmek befogadására vonatkozóan.

Egy másik korabeli újságban tett észrevétel egyértelműbben hangsúlyozza az emberi méret fontosságát, szembeállítva a film nézését a musical „valós jelenetével”: „A műsor sikere – mivel a közönség szereti az élethű csodás hatásokat és a mulatságos megoldásokat – a mulattató és sokáig előkészített csók volt, May Irwin csókja a The Widow Jones-ból. A hatások ebben csodálatosak voltak. Az alakok olyan óriásiak voltak, hogy majdnem az ajkak mozgásából ki lehetett olvasni mit mond Rice Irwinnek, és ő mit válaszol. Arckifejezése pontosan megegyezett az özvegyével, és ugyanígy Rice-é is a szereplőével, maga a valós jelenet soha nem váltott ki ilyen mulatságot, mint a vitaszkópban való bemutatáskor, és ez nagyon sokatmondó.” (52) A méret tényleg számít, főleg amikor az ajkak mozgásáról van szó: az elképzelt beszédaktus előhívja a közönség saját, lelkes vokalizációját, ahogyan egy harmadik beszámoló megjegyzi: „Mosolyukat, pillantásaikat, kifejező gesztusaikat [Irwiné és Rice-é] és a végső vidám érzéki csókolózást újra és újra megismételték, míg a közönség hangosan helyeselt.” (53) A vásznon bemutatott társas aktus ugyanolyan társas választ váltott ki a varieté nézőterén.

Nyilvánvalóan a film vonzerejét nem csupán a színészek kifejező arcának felnagyítása hozta létre, hanem a köztük lévő erotikus szikrának is köszönhető. A kép a voyeurisztikus intimitás lehetőségét nyitotta meg a korai mozinézők számára, akik nyilvánosan és szabadon hangot adhattak élvezetüknek, valósággal biztatták a virtuális csókolózó párt, amint a filmet újra és újra levetítették. Ám a film intimitása eltúlzott, emlékezzünk csak arra, hogy Edison vitaszkópja színházi produkció részletét rögzíti, melyet előzetesen jól begyakoroltak, és a nézők is jól ismertek.  A jelenet ismerős volta valójában lehetővé tette a nézők számára azt a biztonságot és kényelmet, mely által csoportként hangosan megnyilvánulhattak, bár azt is meg kell jegyezni, hogy néhány néző morálisan tiltakozott a csók ellen mint a fizikai vulgaritás visszataszító kiállítása ellen, melyet „gargantuai méretekre felnagyítottak, és háromszor is megismételtek”. (54) A musical sikere szintén segít megmagyarázni, hogy a közönség miért élvezte, hogy „szinte” le tudta olvasni a pár ajakmozgását, akár egy süketnéma (nem pedig frusztrálta őket, mint engem); feltehetőleg egyesek már kívülről tudták azokat a sorokat, amelyek elvezetnek ahhoz a pillanathoz, mely „túl sugárzó ahhoz, hogy jelzőkkel le lehessen írni”. A csók a filmben (az első a filmes hagyomány sorában) szemtelenül megtestesítette Demeny „Je vous aime”-jét, a természet vágynyelvét, bár sokkal kevesebb szóval, és ezáltal kevesebb kétértelműséggel, mint annak megelőlegező diskurzusa. (55)

Az egyik ok, amiért nehéz a szájukról olvasni, hogy amikor beszélnek, testük egymáshoz van préselve (mint Eng és Chang sziámi ikreké?); a csókolózást megelőző gesztus, az ölelkezés – hogy kölcsönvegyük a World kifejezését – arra utal, hogy a film látványát és képzelt hangját kiegészíti egy másik érzék, a tapintásé. Mozdulataik szoros olvasása valójában rámutat arra, hogy testük milyen furcsán viselkedik, főleg az Irwiné. A Looking Out: Visualizing Self-Consciousness című fejezetben [a Body Shots. Early Cinema’s Incarnations című könyv második fejezete – a ford.] rámutattam arra, hogy a Lumière-aktualitásokban szereplő alakok tudatosan megosztják figyelmüket a keretben zajló események és a kereten kívülről rájuk irányuló kamera között. A filmben Irwin és Rice is bizonytalan abban, hogy vajon egymásnak beszéljenek-e, vagy Edison apparátusához (és így a közönséghez, mely látni fogja majd a vetített képeket). A szerelmesek a dialógust nem szemtől szembe egymásnak szavalják, inkább a fejük kicsavarodik, és egymásnak nyomódik harmincfokos szögben. Amikor csókolóznak, természetesen egymás felé fordulnak, és lehunyják a szemüket, kizárva így a közönséget. A kérdés így az, hogy milyen viszonyban áll a beszédük és a csókolózásuk? Vajon a csók egyszerűen csak a tetőpontja vagy kiterjesztése a párbeszédüknek, vagyis a szenvedélyes szavak és a vonzalom fizikai jele ugyanabból a forrásból erednek? Vajon ez az özvegy „nagy szájának” értékére utal, ahogyan McGuirk beszámolt róla idézve Irwint, miszerint „A szájam egyik szélén tudok beszélni magával, maga megcsókolhatja a másik szélét”? (56) Vagy talán a csók az ajkak cselekvése, mely megállítja a beszédet, „megállítja a szájat”, amint Benedict ragyogóan rámutat a Sok hűhó semmiért-ben, amikor a darab végén véget akar vetni Beatrice szellemes évődésének. (57) Shakespeare csókja feleslegessé teszi az ilyen verbális szellemeskedést.

Egy 1901-ben született értekezésben, The Kiss and Its History című munkában a románcfilológia professzora előadta saját anatómiáját, a világirodalom, népművészet és a szokások nagy tudásról tanúskodó áttekintését. Miután meghatározza és osztályozza a különböző típusú csókokat (erotikus, gyengéd, szertartásos stb.), Christopher Nyrop felteszi a csók eredetére vonatkozó bonyolult kérdést: „Hogyan képes az ajkak triviális mozgása legbensőbb érzelmeink annyira ékesszóló értelmezőjévé válni, hogy nincs is olyan nyelv, amelynek olyan szavak állnának a rendelkezésére, melyek megközelítenék annak argumentatív erejét?” (58) A verbális érintkezés és a nem verbális gesztus ellentétét hangsúlyozva Nyrop ennek az erőnek a forrását, némileg meglepő módon, az audiovizuálison kívül eső három másik érzékben jelöli meg, a tapintásban, a szaglásban és az ízlelésben, feltételezve, hogy a csók intenzív érzéki kielégülése valójában abból a primitív ösztönből fakad, hogy megegyük (ha nem is egészében lenyeljük) a szeretett lényt. Bármennyire is érdekfeszítő, Nyrop elmélete az én természetére vonatkozó konfúzión alapul, vagyis azon, hogy a csók vajon az egyén legbensőbb érzelmeit fejezi-e ki, vagy inkább argumentációs forma vagy meggyőzés, mely az emberek közt jön létre. Néhány év múlva az amerikai szociálpszichológus George Herbert Mead épp ezt a zűrzavart akarta megoldani, amikor az én társadalmi genezise mellett érvelt.

Mead gondolkodásában központi jelentőségű a vokális gesztus. Darwin és Wundt elméleteire alapozva, de radikálisan felül is vizsgálva azokat, Mead a gesztust mindenek felett álló kommunikatív aktusnak tekinti, közös nyelvnek, s nem a belső gondolat vagy érzés artikulációjának. Mead a vokális melléknevet részesíti előnyben a verbálissal szemben, akárcsak Darwin vagy Appelbaum, mivel egyszerre akarja megtartani az emberi hang testi, materiális, természeti és társadalmi jellegét, így példái – a madárfütty és a kutyaharc – az állatvilágból származnak. Mead szerint Wundt kodifikált gesztus fogalmát széthasította a belső pszichológia és a külső fiziológia közti hiányos párhuzam, mely hasonló ahhoz a nyugtalanító kettőséghez, melyet Rousseau fedezett fel Condillac elméletében a nyelv eredetéről. Mead ragaszkodik az egységesebb gestalthoz, és megpróbálja elképzelni az „attitűdök” azon teljes készletét, amelyeket két ugató kutya felvehet, amikor találkoznak egymással és dulakodni kezdenek. Ezek az attitűdök dinamikusak és rugalmasak, mivel a kutyák nemcsak pózolnak egymásnak, hanem tudatában is vannak annak, hogy ezt teszik, így tehát egy kölcsönös információ-visszacsatolási hurokban vesznek részt, mindketten folyamatosan figyelik és változtatják viselkedésüket annak alapján, hogy mit észlelnek a másik viselkedéséről. (59) Talán erőltetettnek tűnik Rice és Irwin lefilmezett interakcióját kutyaharchoz hasonlítani, mindazonáltal Mead elemzése a vokális gesztusról tökéletesen illik azokhoz a kezdeti és kölcsönös igazításokhoz, melyeket a kamera felvett, és a közönség is észrevett, s melyek a filmes csókban végződtek. Éppen azért, mert a szavak jelentése nem vonja el a figyelmünket, a pár mozgó ajkai testük kifejező mozgását hangsúlyozzák, a „gesztusok beszélgetését”, melyet Mead a társadalmiság alapjának tekint.

De miért van egyáltalán szüksége Meadnek a vokális terminusra, miért nem egyszerűen a fizikai gesztust tekinti (ahogyan Wundt tette) a nyelv alapjának? Azért, mert mind az ugató kutyák, mind a beszélgető emberek számára a visszacsatolási hurok folyamatos tudatosságot követel, ami az érzékek összefüggésében azt jelenti, hogy ne csak lássák egymást, hanem hallják is. Mivel a szemek a fej elülső részén helyezkednek el, a testünket csak hiányosan látjuk; mivel csak részlegesen látjuk azt, ahogyan mások látnak bennünket, Mead úgy gondolja, hogy a fülekre támaszkodunk, hogy felfogjuk azt, amit a szemek képtelenek érzékelni a kommunikáció szakadatlan cselekvésében, ami nem más, mint az én társas lényként való létrejövése. Kockáztatva, hogy a hallást a jelenlét teleologikus médiumaként értékeli (szemben a látással), Mead azt gondolja, hogy amikor beszélünk, vagy vokális gesztusokat csinálunk, „halljuk magunkat, amint beszélünk, és annak a fontossága, amit mondunk, ugyanaz számunkra, mint mások számára.” (60) A hallás úgy működik, mint egy ellenőrző tükör, melyre valójában nem lenne szükség, egyidejűleg téve lehetővé az öntudatot és mások tudatát (Mead számára a kettő ugyanaz).(61) Még akkor is, ha mozinézőkként teljesen egészükben látjuk May Irwint és John Rice-t, nekik nem kell látniuk a másik arcát, melyet egymáshoz préselnek egy bizonyos szögben, mivel képesek egymást hallani még akkor is, ha számunkra nem hallhatóak. Ezért fontos a beszélgetésük a csók előtt: a beszéd és a csók az orális interakció két különböző, de logikusan összekapcsolt formája.

Bár a hangot egyfajta kifejező cselekvésként kezeli, Mead vokális gesztus fogalma elutasítja a Fül és a Szem közti egyszerű analógiát, melyet Edison hirdetett. A korai moziban a látás és a hang nem együtt működnek, és nem is párhuzamosan, hanem néha ellentétes célokat kergetnek, vagy elkezdenek versengeni egymással, mint Méliès híres Utazás a Holdba (Voyage dans la Lune, 1902) című filmjében, ahol a holdarc csak azután beszélhet, miután az utazók rakétája kiszúrta a szemét. Ennek a versengésnek a felbecsülésére A nagy nyelés (1901) című film szoros elemzése a legjobb példa, a James Williamson által készített brit bohózat. A film magányos embert mutat, aki szembeáll a kamerával, így felidézni látszik a „beszélő portrékat”, melyeket egy évtizeddel korábban készített Anschütz, Demeny és Dickson; az utóbbi 1891-ben készített egy kísérleti filmet magáról, amint Edisont üdvözli. (62)

Az eddigiekben elemzett két példa Edison vokális gesztusaira – Fred Ott tüsszentése (1894) és A csók(1896) – kétségkívül az átmenet jelentős pillanatait képezi, az előbbi az első kereskedelmi mozgókép (kinetoszkóp) bevezetését, a második két évvel később a kinetoszkópról a vetített mozira való átállást jelöli. Az 1901-es év kevésbé jelent fordulópontot a filmes intézmények történetében, inkább a filmforma megváltozásában, mégpedig a narratívában hoz változást. Míg a legtöbb koraifilm-történész – Tom Gunning mostanra bevett megfogalmazását használva – az „attrakciók” korszakának közepére helyezné 1901-et, nem látom be, hogy az olyan trükkfilm, mint A nagy nyelés, miért ne mondhatna történetet, mégpedig nagyon bonyolult allegorikus történetet. (63) Ennek a filmnek az esetében, mint ahogy más, Williamson és honfitársai, Robert Paul és George Albert Smith által készített filmeknél, az attrakció látványossága és a narratív integráció nem egymást kölcsönösen kizáró bináris oppozíciók, hanem szembetűnő módon kölcsönösen erősítik egymást 1901 környékétől kezdve.

A nagy nyelés három beállításból álló narratíva, mely egy perc terében (hogy összecseréljük a metaforákat) négy, különféle típusú médium bonyolult játékát valósítja meg: az írásét, a fotográfiáét, a beszédét és a mozgóképét. Egy úriember felnéz a könyvolvasásból és közvetlenül a kamerába néz. Beteszi a könyvet kabátja belső zsebébe, és elkezd felénk sétálni, egyértelmű, hogy megzavarták, ajkai frenetikusan mozognak, amint haragosan panaszkodik. Amint közelebb jön, erőszakosan hadonászik a pálcájával, nyitott szája egyre nagyobb és nagyobb lesz. A felnagyított emberi arc mozgó ajkak hatalmas párosává válik, melyet a vitaszkóp nézői öt évvel korábban annyira csodáltak, s melyen hirtelen az eltúlzott groteszkség uralkodik el. A tátongó nyílás csakhamar teljes sötétségbe borítja a vásznat. Hirtelen ugrás következik a második beállításra, mely egy fotográfust mutat ügyetlen apparátusával, amint a nagy fekete lyuk elnyeli őket (pontosabban elmerül benne, miután kamerája beleesik). A harmadik beállítás visszatér a kezdő nézőponthoz, de az úriember most visszafelé sétál, vigyorog, és a száját nyalogatja elégedettsége jeléül. Nyrop elgondolása a csókról mint az evés civilizált formájáról itt szó szerintivé válik, mely többé már nem a szeretők szenvedélyes csókolózása, hanem ugyanannyira szenvedélyes gesztusa az ellenségességnek, mely az egyén és az őt rögzíteni kívánó apparátus között jön létre. A nagy nyelés elbűvölő szabadalmi abszurditást kínál: hogyan lehet magát (a film vagy fotó)kamerát elfogyasztani? De mielőtt erre válaszolnánk, nézzük meg először, hogyan viszi színre a film a vizualizáció és a vokalizáció közti csatát.

Noel Burch szerint a film az osztályellentétet dramatizálja, és a kép vitatott tulajdonlását állítja középpontba. (64) A felső osztálybeli úriember úgy érzi, hogy személyes terét megsértette az ostoba fotográfus, aki őt képpé akarja alakítani. Még ha nem is egy Kodak-őrült (a felszerelése nem hordozható), a kamerás kotnyeles a második beállításban az „amatőr fotográfus istencsapása” [„amateur photographic pest„], ahogyan egy 1890-ből származó Punch képregény nevezte ezt a típust, egy protopaparazzo, aki kiköveteli büntetését. (65) A viszály lépre csalja a fotográfiát mint a nyilvánosságnak egy olyan módját, mely szembeáll a könyvvel; ez utóbbi a sérthetetlen individuumot jelöli: az úriembert erőteljes kiabálásával és fenyegető pálcamozdulataival, melyek a megsértett magánélet számlájára írhatók. Hangja egyszerre fejezi ki és védelmezi személyét. A csókban előadott párbeszéddel ellentétben, ebben az esetben kevésbé fontos, hogy pontosan mit mond, hiszen végül is ez nem egy már létező színházi előadás lefilmezése. (66) Csak annyit kell észrevennünk, hogy ajkai őrülten mozgásban vannak, hogy kifejezzék felháborodását. A vokalizáció puszta gesztusa számít (hogy Meadet idézzük), nem annak szemantikai tartalma; beszéde fegyverré válik, mely a kameraszemet fenyegeti.

De az ember száját viszont a kamera fenyegeti, mely hipnotikusan vonzza magához egyre közelebb, mintha csak akarata ellenére történne. Közeledése közben például középen valahol különös módon oldalra fordul, miközben megállás nélkül beszél, hogy megszólítson valakit vagy valamit, ami előtte van, de a kereten kívülre esik. Míg May Irwin és John Rice harminc fokban a kamera felé fordulnak, hogy jelezzék, hogy tudnak a közönségről, ez az úriember harminc fokban elfordul a kamerától, mintha csak attól tartana, hogy elveszíti az egyre kényelmetlenebb bámuló versenyt. Burch úgy értelmezi ezt a furcsa mozdulatot, számomra kissé valószínűtlen módon, mint ami megelőlegezi a mozi későbbi tiltását (ami 1910 körül veszi kezdetét), mely megtiltja a színészeknek, hogy közvetlenül a kamerába nézzenek, vagyis megtörjék a filmi illúzió mimetikus önállóságát. (67) Ehelyett a képen kívülre szóló gesztus inkább egy kissé felkészít minket a második beállításra.

Ha a film véget érne a groteszk módon felnagyított száj szürreális feketéségével, biztosak lehetnénk a kamera megsemmisítésével kapcsolatban, a beszéd győzne a látás felett. Ez bizonyára megnyugtatóbb befejezés lenne ma számunkra, de Williamson bevezet egy másik perspektívát, mely egy másik embert tár fel az apparátus mögött. A második beállítás azért üt el annyira élesen az előzőtől számunkra, mivel a klasszikus hollywoodi narratíván edződve biztosra vesszük, hogy a magányos úriembert a filmfelvevőgép mindentudó szeme zaklatja. De a nem látható kameraszem és a fényképezőgép lencséje nem egy és ugyanaz. Kicsit (talán kétségbeesetten?) félrenézve, az úriember az első beállításban arra figyelmeztet bennünket, hogy a keret nem foglal mindent magába, a kamera által megmutatott világon kívül vagy a mögött, van egy másik külső világ is. Mindazonáltal, amikor ragaszkodik ahhoz, hogy megmutassa a nyelés pillanatát ebből a külső nézőpontból, a „fotográfus istencsapását” a látás egy másik, harmadik személyű megtestesített tárgyává változtatja, vagyis Williamson akaratlanul is beismeri, hogy a fotografikus szem, legalábbis a filmfelvevő, felülkerekedik rajta, és ezért nem lehet alárendelni a hangnak. A második beállítás azáltal, hogy behozza a fotográfust a mozgóképbe, a képek végtelen sorának a lehetőségét kínálja, elfogyasztott kamerák hosszú sorát, melyben minden felfalt nézőpontnak azon nyomban egy másik, tágabb nézőpont veszi át a helyét. Nincs hely, ahová el lehetne rejtőzni, nincs mód a láthatóság elkerülésére, és lehetőség sincs a mozi apparátusának a megemésztésére vagy fizikai bekebelezésére, amivel a dühös ember megpróbálkozott. Bár a hátráló álkannibál a harmadik beállításban mutatja, hogy élvezi, amit megízlelt, amikor a film visszatér közvetlen megszólítási módjához, győzelme szerfelett értelmetlen, mint ahogy ő maga is rájönni látszik erre, amikor bolondosan (de csendesen) mosolyog a film végén.

A nyitott szájú, néma vigyor, mely A nagy nyelést zárja, hasznosan jelezheti a korai mozi vokális gesztusainak egyfajta határát. A látás győz a hang felett, az úriembernek nincs mit mondania. A hallhatatlan, de elképzelt beszédet, éneket és zenét továbbra is közvetlenül kiváltják a vásznon megjelenő alakok, amint beszélnek, táncolnak vagy hangszeren játszanak. A test és a hang egyesítésének reménye a mozgókép által szertefoszlani látszik, és az elkövetkező két évtizedben átadja helyét a narratív film jelölő gyakorlatainak: a mozgás egyetemes hieroglifa-nyelvének, melyet Vachel Lindsay magasztalt, az analitikus szerkesztés technikáinak, az érzelmek sokféleségét kódoló arcközeliknek, a színészek konvencionalizált „ékesszóló gesztusainak”, feliratoknak, melyek helyszíneket írnak le, és megmagyarázzák a motivációt, és rengeteg hangi kíséretnek, beleértve bonyolult zenei témákat és visszatérő motívumokat. (68) Alkalmanként más lehetőségek is adódhatnak az emberi hangok rögzítésére, mint amilyet Parker Tyler fedezett fel, amikor egy korai Sarah Bernhardt filmet nézve nagyszerűen észrevette, hogy „az arcán, ó jaj, látható saját hangjának elmélyült hallgatása”. (69) De Edison álmának az összetett apparátusról, mely az emberi érzékek folyamatos operáját reprezentálja, még váratnia kellett magára, és azóta is várat magára.

 

Fordította: Füzi Izabella

[A fordítás a Bolyai János Kutatási Ösztöndíj támogatásával készült.]

[A fordítás alapjául szolgáló szövegkiadás: Jonathan Auerbach: The Vocal Gesture. Sounding the Origins of Cinema. In uő: Body Shots. Early Cinema’s Incarnations. University of California Press, 2007. 63-81. A fordítást a szerző engedélyével tesszük közzé.]

Erre a szövegre így hivatkozhat:

Jonathan Auerbach: A vokális gesztus. A mozi eredeteinek hangjai. Ford. Füzi Izabella. Apertúra, 2011. ősz. URL:

https://www.apertura.hu/2011/osz/auerbach-a-vokalis-gesztus-a-mozi-eredeteinek-hangjai/