Till Fischer
commited on
Commit
·
5741580
1
Parent(s):
c7ad5e5
Update all changes
Browse files
app.py
CHANGED
@@ -6,12 +6,19 @@ from pathlib import Path
|
|
6 |
import tempfile
|
7 |
import shutil
|
8 |
import os
|
9 |
-
|
10 |
import nltk
|
|
|
|
|
|
|
|
|
11 |
try:
|
12 |
-
nltk.data.find(
|
13 |
-
|
14 |
-
|
|
|
|
|
|
|
|
|
15 |
|
16 |
def run_analysis(db_file, isbn, languages):
|
17 |
if not isbn.strip():
|
|
|
6 |
import tempfile
|
7 |
import shutil
|
8 |
import os
|
|
|
9 |
import nltk
|
10 |
+
import logging
|
11 |
+
|
12 |
+
# --- NLTK-DATEN-SETUP ---
|
13 |
+
# Dieser Block stellt sicher, dass die notwendigen Daten beim Start des Spaces vorhanden sind.
|
14 |
try:
|
15 |
+
nltk.data.find('tokenizers/punkt')
|
16 |
+
logging.info("NLTK 'punkt'-Daten bereits vorhanden.")
|
17 |
+
except nltk.downloader.DownloadError:
|
18 |
+
logging.info("NLTK 'punkt'-Daten nicht gefunden. Lade herunter...")
|
19 |
+
nltk.download('punkt', quiet=True) # quiet=True verhindert zu viel Log-Ausgabe
|
20 |
+
logging.info("NLTK 'punkt'-Daten erfolgreich heruntergeladen.")
|
21 |
+
# --- ENDE NLTK-SETUP ---
|
22 |
|
23 |
def run_analysis(db_file, isbn, languages):
|
24 |
if not isbn.strip():
|