März 2009, Nr. 13, Ausgabe 1 – Spitzentechnologieforschung bei JSTOR
JSTOR engagiert sich dafür, bei der technologischen Innovation eine aktive Rolle zu übernehmen. Zu diesem Zweck haben wir vor über einem Jahr eine Arbeitsgruppe Spitzentechnologieforschung gebildet. In Zusammenarbeit mit anderen Wissenschaftlern überall in der akademischen Gemeinschaft besteht das Ziel dieses Teams in der Erarbeitung und Anwendung der Technologie zur Verbesserung, Erkundung und Ermöglichung der effizienteren Nutzung des Inhalts des JSTOR-Archivs. Wir hoffen, dass wir damit den Gemeinschaften, denen wir dienen, einen wichtigen zusätzlichen Nutzen verschaffen.
Das Team
Dem team gehören Wissenschaftler und Techniker aus den verschiedensten Bereichen an, einschließlich der Mathematik, Genetik, Bibliothekswissenschaft und der Informatik. Wir arbeiten zusammen mit und unterstützen andere Wissenschaftler aus der akademischen Gemeinschaft und darüber hinaus. In wissenschaftlichen und anderen Forschungsinstituten wird eine Unmenge an aufregender und innovativer Arbeit geleistet, die wir uns zu Nutze machen werden, um die wissenschaftliche Forschung als Ganzes zu unterstützen.
Der JSTOR-Schaukasten
Diesen Monat haben wir den JSTOR-Schaukasten . Das wird unser wichtigstes Medium sein, um neue Technologien vorzuführen, die von uns oder von anderen entwickelt wurden. Dabei handelt es sich um eine Art “JSTOR-Labor”-Site, wo wir gegenwärtig unsere Projekte zu Schau stellen, einschließlich „Daten für die Forschung“ (Data for Research) und verschiedene andere Gemeinschaftsprojekte.
Die Vorzeigeprojekte befinden sich absichtlich in der Anfangsphase und werden möglicherweise nie zu ausgewachsenen JSTOR-Angeboten. Wir benutzen den Schaukasten, um Benutzern Technologien zu zeigen, damit wir Feedback erhalten und einschätzen können, ob wir diese weiterentwickeln sollen oder nicht. Mithilfe der Pilotangebote und Prototypen, die wir hier zur Schau stellen, gelingt es uns, schnell herauszufinden, was die Benutzer als wertvoll erachten und wie sie das JSTOR-Archiv am liebsten ansehen und analysieren möchten. Bei den sich gegenwärtig in der Entwicklung befindlichen Projekten werden Daten- und Text-Mining, moderne Visualisierungs- und Analysemethoden sowie Bildverarbeitung und -untersuchung verwendet. Dafür interessieren sich höchstwahrscheinlich Wissenschaftler, die in zahlreichen Fachgebieten tätig sind.
Der Schaukasten ist nicht nur ein Ort, wo JSTOR die Arbeit seiner Wissenschaftler vorstellen kann, sondern auch ein Ort an dem unsere Forschungspartner neue und interessante Wege aufzeigen können, wie die Informationen in unserer Sammlung aufgespürt und verwendet werden können. Bestandteil unserer Partnerschaft sind gegenwärtig Einrichtungen aus Deutschland, Frankreich, Großbritannien sowie den USA, und sie beinhaltet nützliche Tools, Verfahren und Beschreibungen laufender Forschungen auf Gebieten wie beispielsweise der Visualisierung, Erforschung, Entdeckung und Analyse von Text, Bildern und Struktur.
Zu unseren gegenwärtigen Partnern gehören u.a.:
- DFKI (Deutsches Forschungszentrum für künstliche Intelligenz), Deutschland
- George Mason University, USA
- Los Alamos National Laboratory, USA
- Princeton University, USA
- Tufts University, USA
- University of Illinois, USA
- University of Liverpool, Großbritannien
- University of Illinois, USA
- University of Queensland, Australien
- University of Toronto, Kanada
- University Washington, USA
Weitere Projekte anderer Herkunft befinden sich gegenwärtig im Entwicklungsstadium.
Daten für die Forschung
Eine der ersten Bemühungen dieser Arbeitsgruppe besteht in einem neuen Angebot unter dem Namen Daten für die Forschung (Data for Research - DfR). DfR stellt ein Visualisierungstool zur Verfügung, mit dem die Daten in JSTOR analysiert werden können, sowie die Möglichkeit, Meta-Datensätze und Zählungen der Worthäufigkeit herunterzuladen.
Die Benutzer können mithilfe eines Erkundungstools Datensätze erstellen, und sie können in verschiedenen Zeitspannen nach verschiedenen Wörtern suchen, wobei sie ihre Suche nach Fachgebiet, Zeitschrift, Sprache oder Art des Artikels eingrenzen können. Zur Unterstützung der Datenanalyse stehen ihnen Grafiken zur Verfügung, die bestimmte Aspekte des Teils des JSTOR-Korpus zeigen, an dessen Erstellung sie arbeiten.
Wenn die Benutzer ihre Datensätze erstellt haben, senden sie ihre Abfragen ab, und dann werden die Wortzählungen für ihre Datensätze zum Herunterladen zur Verfügung gestellt. Die heruntergeladenen Dateien können direkt in Tabellenkalkulationsprogrammen, wie zum Beispiel Microsoft Excel, geöffnet werden. Die Benutzer können diese Daten beeinflussen und Grafiken und Diagramme erstellen, um neue und interessante Informationen zu gewinnen.
Im Anschluss sind einige interessante Fakten aufgeführt, die aus dem Daten-für-die-Forschung-Tool abgeleitet werden können:
- Die Verwendung des langen s—der Buchstabe, der häufig in Dokumenten vor1800 auftritt und wie ein ƒ— rging nach 1800 drastisch zurück. Versuchen Sie es: Suchen Sie theƒe (das lange s wird vom Computer als ƒ gelesen) und sehen Sie sich das Liniendiagramm an, um festzustellen, wie der Gebrauch drastisch zurückgeht.
- Der Gebrauch des Wortes hath stirbt im allgemeinen Wortschatz um 1900 aus. Es wurde bis 1900 in allen Fachbereichen häufig verwendet. Nach 1900 wurde es jedoch nur in Zeitschriften aus den Bereichen Sprache und Literatur sowie Geschichte gebraucht. Versuchen Sie es: Suchen Sie nach dem Wort hath und bewegen Sie den Schieber für die Datumsleiste nach oben und nach unten —Sie können die Ergebnisse im Kreisdiagramm ablesen.
- Die Digitalisierung alter Bücher und Zeitschriften, die jetzt im Internet zur Verfügung stehen, hat zu einer Zunahme zitierter älterer Literatur geführt. Versuchen Sie es: Suchen Sie nach dem Wort chymistry. Aus dem Liniendiagramm ist ersichtlich, dass der Gebrauch im Laufe der Zeit nachlässt, bis zur jüngsten Jahrhundertwende, wo plötzlich ein Spitzenwert zu verzeichnen ist. Um herauszufinden, wie dieser Spitzenwert zustande kommt, müssen Sie die Daten herunterladen. Nachdem Sie das getan haben, werden Sie anhand der Daten feststellen, dass dieser Umstand auf verschiedene Zeitschriften zurückzuführen ist. Die Suche nach den entsprechenden Zeitschriftentiteln, Jahrgängen und dem Wort chymistry in JSTOR wird ergeben, dass das Auftreten dieses Wortes in Zitierungen zu finden ist—die heutigen Wissenschaftler verwenden also im Internet digitalisierte Arbeiten bei ihrer Forschung!
Werden Sie Teil der Gemeinschaft
Besuchen Sie Daten für die Forschung und Schaukasten um die Exhibits zu erkunden, Kommentare abzugeben und Feedback zu liefern.
Wenn Sie glauben, dass Sie über Forschungsarbeiten oder Tools verfügen, die für die breitere JSTOR-Gemeinschaft von Wert sein könnten, setzen Sie sich mit uns in Verbindung unter dfr@jstor.org.
