Dmedia

Add quick id function to speed up import dedup

Bug #671949 reported by Jason Gerard DeRose on 2010-11-06

This bug affects 1 person

Affects		Status	Importance	Assigned to	Milestone
	Dmedia	Fix Released	High	Akshat Jain	Dmedia 0.1 "cleanup"

Bug Description

We need a quick dedup to run when importing files that may have already been imported. This is especially important when importing large files (say 4GB MOV) over slow USB2. A good algorithm would probably be something like:

hash(utf-8 repr of mtime + 1024k + last 1024k)

Corner cases are when total file is less than 1MiB and when less than 2MiB.

This function should go in dmedialib/filestore.py and should have a signature like:

quick_id(filename=None, fp=None)

When you can pass either a filename or an open file handle.

Tags:

Related branches

lp:~akshatj/dmedia/quick-id

Merged into lp:~jderose/dmedia/trunk at revision 106

Jason Gerard DeRose: Pending requested 2010-11-14

lp:~jderose/dmedia/trunk

Jason Gerard DeRose (jderose) on 2010-11-06

Changed in dmedia:
milestone:	none → 0.1
importance:	Undecided → High
status:	New → Triaged

Akshat Jain (akshatj) on 2010-11-14

Changed in dmedia:
assignee:	nobody → Akshat Jain (ssj6akshat1234)
status:	Triaged → In Progress

Akshat Jain (akshatj) on 2010-11-14

Changed in dmedia:
status:	In Progress → Fix Committed

Jason Gerard DeRose (jderose) on 2010-11-24

Changed in dmedia:
status:	Fix Committed → Fix Released

Report a bug

This report contains Public information

Everyone can see this information.

You are

Subscribing...

Edit bug mail

Other bug subscribers

Remote bug watches

Bug watches keep track of this bug in other bug trackers.