2015-12-28 15 views
8

Ich verwende MPTT in einem Modell ein Tagging-System zu verwalten (jeden Tag hat eine optionale TreeForeignKey zu einem Tag ‚Eltern‘)Django MPTT Postgres Update-Abfrage läuft langsam

Jedes Mal, wenn ich einen Tag Modell speichern muß, die folgende Abfrage läuft außerordentlich langsam (ab 45 Sekunden)

UPDATE "taxonomy_taxonomy" SET "tree_id" = ("taxonomy_taxonomy"."tree_id" + %s) WHERE "taxonomy_taxonomy"."tree_id" > %s 

ich den Inhalt von Artikeln durch ein automatisiertes Tagging-System zu senden, die sich nach oben von 20 Tags erzeugen kann. Offensichtlich wird das nicht fliegen :)

Ich fügte die db_index = False in der Hoffnung, Schreibzeiten zu ändern (liest nicht scheinen, ein Problem sein), aber das Problem besteht weiter.

Hier ist das Modell in Frage:

class Taxonomy(MPTTModel): 

parent = TreeForeignKey('self',blank=True,null=True,related_name='children',verbose_name='Parent', db_index=False) 
parent_name = models.CharField(max_length=64, blank=True, null=True, editable=False) 
name = models.CharField(verbose_name='Title', max_length=100, db_index=True) 
slug = models.SlugField(verbose_name='Slug', blank=True) 
primary = models.BooleanField(
    verbose_name='Is Primary', 
    default=False, 
    db_index=True, 
) 
type = models.CharField(max_length=30, db_index=True) 
created_date = models.DateTimeField(auto_now_add=True, null=True) 
updated_date = models.DateTimeField(auto_now=True, null=True) 
publication_date = models.DateTimeField(null=True, blank=True) 
scheduled_date = models.DateTimeField(null=True, blank=True) 
workflowstate = models.CharField(max_length=30, default='draft') 
created_by = models.ForeignKey(User, null=True) 

paid_content = models.BooleanField(verbose_name='Is Behind the Paywall', default=False, blank=True) 
publish_now = True 
show_preview = False 
temporary = models.BooleanField(default=False) 

def save(self, *args, **kwargs): 

    if self.slug is None: 
     self.slug = self.name 

    if not self.slug: 
     self.slug = slugify(self.name)[:50] 

    if self.parent: 
     self.parent_name = self.parent.name 

    self.slug = slugify(self.slug) 
    self.workflowstate = "published" 

    super(Taxonomy, self).save(*args, **kwargs) 

    store_to_backend_mongo(self) 
    publish_to_frontend(self) 

Und die Abfrage-Plan (wie von New Relic berichtete):

1) Update on taxonomy_taxonomy (cost=0.00..133833.19 rows=90515 width=139) 

2) -> Seq Scan on taxonomy_taxonomy (cost=0.00..133833.19 rows=90515 width=139) 

3) Filter: ? 

Schließlich ist die Rückverfolgung von einer solchen Abfrage:

Traceback (most recent call last): 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/newrelic-2.54.0.41/newrelic/api/web_transaction.py", line 711, in __iter__ 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/newrelic-2.54.0.41/newrelic/api/web_transaction.py", line 1087, in __call__ 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/django/core/handlers/wsgi.py", line 189, in __call__ 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/django/core/handlers/base.py", line 132, in get_response 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/newrelic-2.54.0.41/newrelic/hooks/framework_django.py", line 499, in wrapper 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/django/contrib/auth/decorators.py", line 22, in _wrapped_view 
File "./editorial/views.py", line 242, in calculate_queryly 
File "./editorial/views.py", line 292, in queryly_function 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/django/db/models/manager.py", line 127, in manager_method 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/django/db/models/query.py", line 348, in create 
File "./taxonomy/models.py", line 179, in save 
File "./taxonomy/models.py", line 58, in save 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/mptt/models.py", line 946, in save 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/mptt/models.py", line 702, in insert_at 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/mptt/managers.py", line 467, in insert_node 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/mptt/managers.py", line 491, in insert_node 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/mptt/managers.py", line 726, in _create_tree_space 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/mptt/managers.py", line 364, in _mptt_update 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/django/db/models/query.py", line 563, in update 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/django/db/models/sql/compiler.py", line 1062, in execute_sql 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/django/db/models/sql/compiler.py", line 840, in execute_sql 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/django/db/backends/utils.py", line 79, in execute 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/django/db/backends/utils.py", line 64, in execute 
File "/data/www/nj-cms/venv/lib/python3.4/site-packages/newrelic-2.54.0.41/newrelic/hooks/database_dbapi2.py", line 22, in execute 

Irgendeine Idee, wie ich diese Modell spart, um schneller zu sein?

EDIT für weitere Infos: Dies ist in Postgres, mit dem psycopg2 Motor 'MOTOR': 'django.db.backends.postgresql_psycopg2',

ZWEITER EDIT: Wie gewünscht, lief ich die Abfrage mit ERKLÄREN SIE ANALYSE. Das Ergebnis ist wie folgt:

nj=# EXPLAIN ANALYZE UPDATE "taxonomy_taxonomy" SET "tree_id" = ("taxonomy_taxonomy"."tree_id" + 1) WHERE "taxonomy_taxonomy"."tree_id" > 1; 

                  QUERY PLAN                
---------------------------------------------------------------------------------------------------------------------------------- 
Update on taxonomy_taxonomy (cost=0.00..9588.75 rows=24582 width=132) (actual time=258718.550..258718.550 rows=0 loops=1) 
    -> Seq Scan on taxonomy_taxonomy (cost=0.00..9588.75 rows=24582 width=132) (actual time=59.956..8271.209 rows=24582 loops=1) 
     Filter: (tree_id > 1) 
     Rows Removed by Filter: 2 
Planning time: 28.763 ms 
Execution time: 258718.661 ms 
(6 rows) 
+0

Whad DB benutzen Sie? ob MySQL, welche Engine, InnoDB oder MyISAM? –

+0

Ah, sollte das enthalten. Ich werde es jetzt bearbeiten. Ich benutze Postgres. Von settings.py: 'ENGINE': 'django.db.backends.postgresql_psycopg2', –

+0

sollten Sie die gleiche Abfrage auf psql mit EXPLAIN ANALYSE ausführen und die Ausgabe hier hinzufügen (die aus dem neuen Relikt ist unvollständig) –

Antwort

6

django MPTT verwendet Nested Set Model

Also, wenn Ihr Verfahren django-MPTT Einfügevorgang speichern verursacht haben viele Daten neu zu berechnen. Es funktioniert einfach nicht an großen Tischen.

Sie müssen die Verwendung von django-mptt ablehnen und Ihr eigenes Datenbankschema erfinden.