Sky
Well-Known Member
Коя е тая тема?@Sky пусни и за темата за чумата.
PHP:
<?php
define('WP_USE_THEMES', false);
require __DIR__.'/wp-blog-header.php';
require 'simple_html_dom.php';
$max_pages = 727;
$base_url = 'https://www.predpriemach.com/threads/%D0%A3%D0%BA%D1%80%D0%B0%D0%B9%D0%BD%D0%B0-%D0%A0%D1%83%D1%81%D0%B8%D1%8F-%D0%BA%D0%B0%D0%BA%D0%B2%D0%BE-%D0%B2%D0%B8-%D0%B5-%D0%BC%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5%D1%82%D0%BE.88802/';
$url = ($_GET['page']) ? $base_url.'page-'.$_GET['page'] : $base_url;
$html = file_get_html($url);
foreach($html->find('article.message') as $post) {
$data['author'] = $post->find('a.username', 0)->plaintext;
$data['user_id'] = $post->find('a.username', 0)->{'data-user-id'};
$data['post_date'] = $post->find('li.u-concealed a time', 0)->{'data-time'};
$data['post_id'] = $post->find('li.u-concealed a', 0)->href;
$data['post_id'] = explode('/post-', $data['post_id'])[1];
$data['content'] = $post->find('div.bbWrapper', 0)->innertext;
$wpdb->insert('posts_table', $data, ['%s', '%d', '%d', '%d', '%s']);
}
$page = ($_GET['page']) ? $_GET['page'] + 1 : 1;
if ($page > $max_pages) {
die;
}
?>
<meta http-equiv="refresh" content="3; url=scrape.php?page=<?php echo $page ?>">
Ето ти шитав код, ще ти трябва WP за базата (това имах отворено и там го написах), дублира първата страница, трябва да изтриеш първите 20