快精灵印艺坊 您身边的文印专家
广州名片 深圳名片 会员卡 贵宾卡 印刷 设计教程
产品展示 在线订购 会员中心 产品模板 设计指南 在线编辑
 首页 名片设计   CorelDRAW   Illustrator   AuotoCAD   Painter   其他软件   Photoshop   Fireworks   Flash  

 » 彩色名片
 » PVC卡
 » 彩色磁性卡
 » 彩页/画册
 » 个性印务
 » 彩色不干胶
 » 明信片
   » 明信片
   » 彩色书签
   » 门挂
 » 其他产品与服务
   » 创业锦囊
   » 办公用品
     » 信封、信纸
     » 便签纸、斜面纸砖
     » 无碳复印纸
   » 海报
   » 大篇幅印刷
     » KT板
     » 海报
     » 横幅

同时提取多条新闻中的文本一例

本文为一个提取一批新闻网页中的文本的小程序,它可以将各篇新闻的内容存为以该新闻标题为文件名的文本文件。如有更好的处理方式,请和我联系:
lwx3069@sina.com
   这里以人民网中的“今日要闻”下的新闻为例.
<?php
($url) ? "" : $url = "http://www.unn.com.cn/GB/channel2/3/11/index.html";        // 今日要闻
if(isset($url)&&$url!="")        {
   $str = implode("",file($url));
   $str_ary = explode("<ul>",$str);
   $str_ary = explode("<li>",trim($str_ary[1]));
   for ($i=0; $i<8; $i++)        {
      if (strlen(trim($str_ary[$i]))<3){
      continue;
      }
      echo "新闻".$i.":".$str_ary[$i];
      $str1=strstr("$str_ary[$i]",\\'<a href="/\\');
      $str2=strstr("$str_ary[$i]",\\'" target\\');
      $len1=strlen("$str1");
      $len2=strlen("$str2");
      $len=$len1-$len2;
      $url=substr("$str1",10,$len-10);
      if (strlen(trim($url))!=0) {
         $url = "http://www.unn.com.cn/".$url;
         define(CONTENTS_DIR,"./contents/");
         if(isset($url)&&$url!="")        {
            $str = implode("",file($url));
            $str1=explode(\\'<div align="right">\\',$str);            //去掉文件没用的上半部分
            $str2 = explode(\\'<h4 align="center">&nbsp; </h4>\\',$str1[1]);
            //取出文件的下半部分,并去掉没用的下半部分,这时得到的都是有用的
            $str3=explode(\\'</font><font size="+2"><b><font size="3">\\',$str2[0]);   //从整个有用部分取出文件标题和正文
            $str4=explode(\\'</div>\\',$str2[0]);   //取出日期和时间
            $str5=explode(\\'</font></b></font><font size="2">\\',$str3[1]);     //从标题和正文部分取出标题
            $title=str_replace("<br>","",$str5[0]);
            $str3=explode(\\'<p><font size="2">\\',$str2[0]);          //从整个有用部分取出文件正文
            $str3[1]=str_replace(\\'<br><br>&nbsp;&nbsp;&nbsp;&nbsp;\\',"n"."  ",$str3[1]);
            $str3[1]=str_replace(\\'&nbsp;\\',"",$str3[1]);
            $str3=strip_tags($str3[1]);
            $pf=trim($title).".txt";
            $ppf=fopen(CONTENTS_DIR."$pf",\\'w\\');
            fputs($ppf,$title);
            fputs($ppf,"$str4[0]");
            fputs($ppf,$str3);
        }
     }
  }
}
?> 
返回类别: 教程
上一教程: 一个取得文件扩展名的函数
下一教程: MySQL通用查询程序

您可以阅读与"同时提取多条新闻中的文本一例"相关的教程:
· 这是我在做的一个系统中的新闻增加程序,可以上传图片,也可以输入绝对大于4K的内容(在textarea中),...
· 一个php作的文本留言本的例子(六)
· 如何将一个表单同时提交到两个地方处理
· PHP编程的文件资源治理一例
· 用文本文件实现的动态实时发布新闻的程序
    微笑服务 优质保证 索取样品