Gibt es eine Möglichkeit, doppelte Dateien in einem Amazon S3-Bucket rekursiv zu finden? In einem normalen Dateisystem würde ich einfach folgendes verwenden:So finden Sie doppelte Dateien in einem AWS S3-Bucket?
2
A
Antwort
5
Es gibt keinen Befehl "Duplikate finden" in Amazon S3.
Allerdings müssen Sie wie folgt vorgehen:
- Abrufen einer Liste von Objekten im Eimer
- Geben Sie für Objekte, die die gleiche
ETag
(Prüfsumme) haben undSize
Sie würden (sehr wahrscheinlich) doppelte Objekte sein.
3
Hier ist ein Git-Repository: https://github.com/chilts/node-awssum-scripts, die eine js-Skriptdatei hat, um die Duplikate in einem S3-Bucket zu finden. Ich weiß, auf eine externe Quelle zu zeigen ist nicht empfohlen, aber ich hoffe, es kann Ihnen helfen.
0
import boto3
s3client = boto3.client('s3',aws_access_key_id=ACCESS_KEY,aws_secret_access_key=SECRET_KEY,region_name=region)
etag = s3client.head_object(Bucket='myBucket',Key='index.html')['ResponseMetadata']['HTTPHeaders']['etag']
print(etag)
+1
Bitte fügen Sie einige Erklärungen zu Ihrer Antwort hinzu –
Verwandte Themen
- 1. So finden Sie doppelte Feldkombination
- 2. So finden Sie doppelte Definitionen aus Vorlagenspezialisierungen?
- 3. So finden Sie ausgecheckt Dateien
- 4. So übertragen Sie Dateien zwischen AWS s3 und AWS ec2
- 5. Wie finden Sie doppelte Schlüssel in Localizable.strings-Dateien automatisch?
- 6. Finden doppelte Werte in einem dictonary
- 7. SQL: So finden Sie doppelte Werte in einer großen Tabelle
- 8. So finden Sie doppelte ContactNo in meiner Tabelle oder nicht
- 9. So finden Sie doppelte Einträge in der Liste <>?
- 10. Finden Sie alle Dateien in einem Ordner
- 11. AmazonS3Client.listObjects() Problem mit großen s3bucket
- 12. Wie finden Sie doppelte Methoden?
- 13. So finden Sie die nicht zugeordneten Elastic-Ips in AWS EC2 mit AWS CLI
- 14. So finden Sie den Ordner "Eigene Dateien" in Java
- 15. So finden Sie Dateien nach RegEx in C#
- 16. So aktualisieren Sie doppelte Datensätze in Grails
- 17. So entfernen Sie doppelte Spaltennamen in R?
- 18. finden Sie eine doppelte Serie in SQL
- 19. So finden Sie den neuesten oder letzten AWS RDS-Snapshot?
- 20. So entfernen Sie doppelte Werte aus einem Array in PHP
- 21. So verhindern Sie doppelte E-Mail-Adressen in einem Benutzerregistrierungsformular?
- 22. So entfernen Sie doppelte Werte in einem Dataset: python
- 23. So entfernen Sie NaNs in aws redshift
- 24. g ++ nicht finden .so Dateien
- 25. So finden Sie Dateien mit vielen Duplikaten in Eclipse
- 26. So geben Sie AWS-Credentials für .NET AWS SDK an
- 27. Wie finden Sie npm doppelte Pakete?
- 28. Doppelte Werte in einem Array finden und alle ausgeben
- 29. Finden Sie Dateien mit passenden Mustern in einem Verzeichnis C#?
- 30. Doppelte Dateien mit ähnlichen Dateinamen in UNIX
Welche Methode würden Sie empfehlen, nach dem gleichen 'ETag' und' Size' zu suchen? – Borealis
Wenn Sie mit dem Befehl ['list-objects'] (https://docs.aws.amazon.com/cli/latest/reference/s3api/list-objects.html) eine Liste von Objekten abrufen, enthält diese das' ' ETag'. –