1.reading wps(reading text):通過流加載wps文件並讀取文本內容。
導入com . spire . doc . *;
導入Java . io . file;
導入Java . io . file inputstream;
導入Java . io . file writer;
導入Java . io . io exception;
公共類ReadTextFromWPS {
公共靜態void main(String【】args)引發IOException{
//通過流加載WPS文本文檔。
File inputStream inputStream = new File inputStream(“test . wps“);
文檔doc =新文檔();
doc.loadFromStream(輸入流,文件格式。doc);
//獲取文本並將其保存為字符串。
string text = doc . gettext();
//將字符串寫入Txt
writestringtoxt(text,“閱讀WPS文本。txt“);
}
公共靜態void writeStringToTxt(字符串內容,字符串txtFileName)引發IOException {
file writer fw writer = new file writer(txt filename,true);
嘗試{
fWriter.write(內容);
} catch(io exception ex ){
ex . printstacktrace();
}最後{
嘗試{
fwriter . flush();
fwriter . close();
} catch(io exception ex ){
ex . printstacktrace();
}
}
}
}
2.讀取et:直接加載et格式的表格文件並讀取數據。
導入com . spire . xls . *;
公共類ExcelToText {
公共靜態void main(String[] args) {
//加載et格式的表格文件。
Workbook workbook =新工作簿();
workbook . loadfromfile(“test . et“);
//獲取工作表
工作表sheet = workbook.getWorksheets()。get(0);
//獲取指定單元格中的文本數據
cell range range = sheet . getcellrange(“a 1“);
String text = range.getText()。trim();
system . out . println(text);
}
}
3.閱讀dps:直接加載dps格式的幻燈片文檔並閱讀文本。
import com . spire . presentation . iautoshape;
導入com . spire . presentation . is lide;
導入com . spire . presentation . paragraph ex;
導入com . spire . presentation . presentation;
導入Java . io . file writer;
公共類ExtractText {
公共靜態void main(String【】args)引發異常{
//加載測試文檔
演示PPT = new Presentation();
//PPT . loadfromfile(“test . pptx“);
PPT . loadfromfile(“test . dps“);
StringBuilder buffer = new StringBuilder();
//遍歷文檔中的幻燈片並提取文本。
for(Object slide:PPT . get slides())
{
for(對象形狀:(ISlide)幻燈片)。getShapes())
{
if(IAutoShape的形狀實例)
{
for(對象TP:((IAutoShape)形狀)。getTextFrame()。getParagraphs())
{
buffer . append((ParagraphEx)TP)。getText());
}
}
}
}
//保存到文本文件
file writer writer = new file writer(“extracttextfromdps . txt“);
writer . write(buffer . tostring());
writer . flush();
writer . close();
}
}
spire.office.jar文件必須在此處導入Java程序。