initial

author: Jesús <heckyel@hyperbola.info> 2021-06-09 17:54:27 -0500
committer: Jesús <heckyel@hyperbola.info> 2021-06-09 17:54:27 -0500
commit: 27fe903c511691c078942bef5ee9a05a43b15c8f (patch)
tree: 50f30ab2ec749b965869518c0a28651f8677f0d3 /hypervideo_dl/extractor/drbonanza.py
download: hypervideo-27fe903c511691c078942bef5ee9a05a43b15c8f.tar.lz
hypervideo-27fe903c511691c078942bef5ee9a05a43b15c8f.tar.xz
hypervideo-27fe903c511691c078942bef5ee9a05a43b15c8f.zip
1 files changed, 59 insertions, 0 deletions
diff --git a/hypervideo_dl/extractor/drbonanza.py b/hypervideo_dl/extractor/drbonanza.py
new file mode 100644
index 0000000..164e97c
--- /dev/null
+++ b/hypervideo_dl/extractor/drbonanza.py
@@ -0,0 +1,59 @@
+from __future__ import unicode_literals
+
+import re
+
+from .common import InfoExtractor
+from ..utils import (
+    js_to_json,
+    parse_duration,
+    unescapeHTML,
+)
+
+
+class DRBonanzaIE(InfoExtractor):
+    _VALID_URL = r'https?://(?:www\.)?dr\.dk/bonanza/[^/]+/\d+/[^/]+/(?P<id>\d+)/(?P<display_id>[^/?#&]+)'
+    _TEST = {
+        'url': 'http://www.dr.dk/bonanza/serie/154/matador/40312/matador---0824-komme-fremmede-',
+        'info_dict': {
+            'id': '40312',
+            'display_id': 'matador---0824-komme-fremmede-',
+            'ext': 'mp4',
+            'title': 'MATADOR - 08:24. "Komme fremmede".',
+            'description': 'md5:77b4c1ac4d4c1b9d610ab4395212ff84',
+            'thumbnail': r're:^https?://.*\.(?:gif|jpg)$',
+            'duration': 4613,
+        },
+    }
+
+    def _real_extract(self, url):
+        mobj = re.match(self._VALID_URL, url)
+        video_id, display_id = mobj.group('id', 'display_id')
+
+        webpage = self._download_webpage(url, display_id)
+
+        info = self._parse_html5_media_entries(
+            url, webpage, display_id, m3u8_id='hls',
+            m3u8_entry_protocol='m3u8_native')[0]
+        self._sort_formats(info['formats'])
+
+        asset = self._parse_json(
+            self._search_regex(
+                r'(?s)currentAsset\s*=\s*({.+?})\s*</script', webpage, 'asset'),
+            display_id, transform_source=js_to_json)
+
+        title = unescapeHTML(asset['AssetTitle']).strip()
+
+        def extract(field):
+            return self._search_regex(
+                r'<div[^>]+>\s*<p>%s:<p>\s*</div>\s*<div[^>]+>\s*<p>([^<]+)</p>' % field,
+                webpage, field, default=None)
+
+        info.update({
+            'id': asset.get('AssetId') or video_id,
+            'display_id': display_id,
+            'title': title,
+            'description': extract('Programinfo'),
+            'duration': parse_duration(extract('Tid')),
+            'thumbnail': asset.get('AssetImageUrl'),
+        })
+        return info
author	Jesús <heckyel@hyperbola.info>	2021-06-09 17:54:27 -0500
committer	Jesús <heckyel@hyperbola.info>	2021-06-09 17:54:27 -0500
commit	27fe903c511691c078942bef5ee9a05a43b15c8f (patch)
tree	50f30ab2ec749b965869518c0a28651f8677f0d3 /hypervideo_dl/extractor/drbonanza.py
download	hypervideo-27fe903c511691c078942bef5ee9a05a43b15c8f.tar.lz hypervideo-27fe903c511691c078942bef5ee9a05a43b15c8f.tar.xz hypervideo-27fe903c511691c078942bef5ee9a05a43b15c8f.zip