FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4596, 1246 aa 1>>>pF1KE4596 1246 - 1246 aa - 1246 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.0437+/-0.000958; mu= 14.4874+/- 0.057 mean_var=111.4428+/-22.555, 0's: 0 Z-trim(108.5): 14 B-trim: 539 in 1/50 Lambda= 0.121492 statistics sampled from 10259 (10271) to 10259 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.676), E-opt: 0.2 (0.316), width: 16 Scan time: 3.880 The best scores are: opt bits E(32554) CCDS4731.1 SKIV2L gene_id:6499|Hs108|chr6 (1246) 8251 1457.9 0 CCDS3967.1 SKIV2L2 gene_id:23517|Hs108|chr5 (1042) 813 154.2 1.6e-36 >>CCDS4731.1 SKIV2L gene_id:6499|Hs108|chr6 (1246 aa) initn: 8251 init1: 8251 opt: 8251 Z-score: 7813.6 bits: 1457.9 E(32554): 0 Smith-Waterman score: 8251; 99.8% identity (100.0% similar) in 1246 aa overlap (1-1246:1-1246) 10 20 30 40 50 60 pF1KE4 MMETERLVLPPPDPLDLPLRAVELGCTGHWELLNLPGAPESSLPHGLPPCAPDLQQEAEQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MMETERLVLPPPDPLDLPLRAVELGCTGHWELLNLPGAPESSLPHGLPPCAPDLQQEAEQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 LFLSSPAWLPLHGVEHSARKWQRKTDPWSLLAVLGAPVPSDLQAQRHPTTGQILGYKEVL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LFLSSPAWLPLHGVEHSARKWQRKTDPWSLLAVLGAPVPSDLQAQRHPTTGQILGYKEVL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 LENTNLSATTSLSLRRPPGPASQSLWGNPTRYPFWPGGMDEPTITDLNTREEAEEEIDFE ::::::::::::::::::::::::::::::.::::::::::::::::::::::::::::: CCDS47 LENTNLSATTSLSLRRPPGPASQSLWGNPTQYPFWPGGMDEPTITDLNTREEAEEEIDFE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 KDLLTIPPGFKKGMDFAPKDCPTPAPGLLSLSCLLEPLDLGGGDEDENEAVGQPGGPRGD :::::::::::::::::::::::::::::::::.:::::::::::::::::::::::::: CCDS47 KDLLTIPPGFKKGMDFAPKDCPTPAPGLLSLSCMLEPLDLGGGDEDENEAVGQPGGPRGD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 TVSASPCSAPLARASSLEDLVLKEASTAVSTPEAPEPPSQEQWAIPVDATSPVGDFYRLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 TVSASPCSAPLARASSLEDLVLKEASTAVSTPEAPEPPSQEQWAIPVDATSPVGDFYRLI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 PQPAFQWAFEPDVFQKQAILHLERHDSVFVAAHTSAGKTVVAEYAIALAQKHMTRTIYTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PQPAFQWAFEPDVFQKQAILHLERHDSVFVAAHTSAGKTVVAEYAIALAQKHMTRTIYTS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 PIKALSNQKFRDFRNTFGDVGLLTGDVQLHPEASCLIMTTEILRSMLYSGSDVIRDLEWV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PIKALSNQKFRDFRNTFGDVGLLTGDVQLHPEASCLIMTTEILRSMLYSGSDVIRDLEWV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 IFDEVHYINDVERGVVWEEVLIMLPDHVSIILLSATVPNALEFADWIGRLKRRQIYVIST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 IFDEVHYINDVERGVVWEEVLIMLPDHVSIILLSATVPNALEFADWIGRLKRRQIYVIST 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 VTRPVPLEHYLFTGNSSKTQGELFLLLDSRGAFHTKGYYAAVEAKKERMSKHAQTFGAKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VTRPVPLEHYLFTGNSSKTQGELFLLLDSRGAFHTKGYYAAVEAKKERMSKHAQTFGAKQ 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 PTHQGGPAQDRGVYLSLLASLRTRAQLPVVVFTFSRGRCDEQASGLTSLDLTTSSEKSEI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PTHQGGPAQDRGVYLSLLASLRTRAQLPVVVFTFSRGRCDEQASGLTSLDLTTSSEKSEI 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 HLFLQRCLARLRGSDRQLPQVLHMSELLNRGLGVHHSGILPILKEIVEMLFSRGLVKVLF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 HLFLQRCLARLRGSDRQLPQVLHMSELLNRGLGVHHSGILPILKEIVEMLFSRGLVKVLF 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE4 ATETFAMGVNMPARTVVFDSMRKHDGSTFRDLLPGEYVQMAGRAGRRGLDPTGTVILLCK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ATETFAMGVNMPARTVVFDSMRKHDGSTFRDLLPGEYVQMAGRAGRRGLDPTGTVILLCK 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE4 GRVPEMADLHRMMMGKPSQLQSQFRLTYTMILNLLRVDALRVEDMMKRSFSEFPSRKDSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GRVPEMADLHRMMMGKPSQLQSQFRLTYTMILNLLRVDALRVEDMMKRSFSEFPSRKDSK 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE4 AHEQALAELTKRLGALEEPDMTGQLVDLPEYYSWGEELTETQHMIQRRIMESVNGLKSLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 AHEQALAELTKRLGALEEPDMTGQLVDLPEYYSWGEELTETQHMIQRRIMESVNGLKSLS 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE4 AGRVVVVKNQEHHNALGVILQVSSNSTSRVFTTLVLCDKPLSQDPQDRGPATAEVPYPDD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 AGRVVVVKNQEHHNALGVILQVSSNSTSRVFTTLVLCDKPLSQDPQDRGPATAEVPYPDD 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE4 LVGFKLFLPEGPCDHTVVKLQPGDMAAITTKVLRVNGEKILEDFSKRQQPKFKKDPPLAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LVGFKLFLPEGPCDHTVVKLQPGDMAAITTKVLRVNGEKILEDFSKRQQPKFKKDPPLAA 910 920 930 940 950 960 970 980 990 1000 1010 1020 pF1KE4 VTTAVQELLRLAQAHPAGPPTLDPVNDLQLKDMSVVEGGLRARKLEELIQGAQCVHSPRF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VTTAVQELLRLAQAHPAGPPTLDPVNDLQLKDMSVVEGGLRARKLEELIQGAQCVHSPRF 970 980 990 1000 1010 1020 1030 1040 1050 1060 1070 1080 pF1KE4 PAQYLKLRERMQIQKEMERLRFLLSDQSLLLLPEYHQRVEVLRTLGYVDEVGTVKLAGRV ::::::::::::::::::::::::::::::::::::::::::::::::::.::::::::: CCDS47 PAQYLKLRERMQIQKEMERLRFLLSDQSLLLLPEYHQRVEVLRTLGYVDEAGTVKLAGRV 1030 1040 1050 1060 1070 1080 1090 1100 1110 1120 1130 1140 pF1KE4 ACAMSSHELLLTELMFDNALSTLRPEEIAALLSGLVCQSPGDAGDQLPNTLKQGIERVRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ACAMSSHELLLTELMFDNALSTLRPEEIAALLSGLVCQSPGDAGDQLPNTLKQGIERVRA 1090 1100 1110 1120 1130 1140 1150 1160 1170 1180 1190 1200 pF1KE4 VAKRIGEVQVACGLNQTVEEFVGELNFGLVEVVYEWARGMPFSELAGLSGTPEGLVVRCI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VAKRIGEVQVACGLNQTVEEFVGELNFGLVEVVYEWARGMPFSELAGLSGTPEGLVVRCI 1150 1160 1170 1180 1190 1200 1210 1220 1230 1240 pF1KE4 QRLAEMCRSLRGAARLVGEPVLGAKMETAATLLRRDIVFAASLYTQ :::::::::::::::::::::::::::::::::::::::::::::: CCDS47 QRLAEMCRSLRGAARLVGEPVLGAKMETAATLLRRDIVFAASLYTQ 1210 1220 1230 1240 >>CCDS3967.1 SKIV2L2 gene_id:23517|Hs108|chr5 (1042 aa) initn: 1798 init1: 770 opt: 813 Z-score: 769.0 bits: 154.2 E(32554): 1.6e-36 Smith-Waterman score: 1980; 36.4% identity (65.4% similar) in 1013 aa overlap (250-1244:80-1041) 220 230 240 250 260 270 pF1KE4 LGGGDEDENEAVGQPGGPRGDTVSASPCSAPLARASSLEDLVLKE--ASTAVSTPEAPEP : . : ::: : . . :.. :. : CCDS39 GKLQSESTNNGKNKRDVDFEGTDEPIFGKKPRIEESITEDLSLADLMPRVKVQSVETVEG 50 60 70 80 90 100 280 290 300 310 320 330 pF1KE4 PSQEQWAIPVDATSPVGDFYRLIP---QPAFQWAFEPDVFQKQAILHLERHDSVFVAAHT ..: :.:.. :. : : . : .. : :.::..:: .. ..::.:.::: CCDS39 CTHEV-ALPAEE-----DYLPLKPRVGKAAKEYPFILDAFQREAIQCVDNNQSVLVSAHT 110 120 130 140 150 160 340 350 360 370 380 390 pF1KE4 SAGKTVVAEYAIALAQKHMTRTIYTSPIKALSNQKFRDFRNTFGDVGLLTGDVQLHPEAS :::::: :::::::: .. :.:.:::::::::::.:.. . : ::::.:::: ..: :: CCDS39 SAGKTVCAEYAIALALREKQRVIFTSPIKALSNQKYREMYEEFQDVGLMTGDVTINPTAS 170 180 190 200 210 220 400 410 420 430 440 450 pF1KE4 CLIMTTEILRSMLYSGSDVIRDLEWVIFDEVHYINDVERGVVWEEVLIMLPDHVSIILLS ::.::::::::::: ::.:.:.. ::::::.::. : ::::::::..:.:::.: ..:: CCDS39 CLVMTTEILRSMLYRGSEVMREVAWVIFDEIHYMRDSERGVVWEETIILLPDNVHYVFLS 230 240 250 260 270 280 460 470 480 490 500 510 pF1KE4 ATVPNALEFADWIGRLKRRQIYVISTVTRPVPLEHYLFTGNSSKTQGELFLLLDSRGAFH ::.::: .::.:: .:... .:: : ::.::.::.: .... : : :..: : :. CCDS39 ATIPNARQFAEWICHLHKQPCHVIYTDYRPTPLQHYIFPAGGD---G-LHLVVDENGDFR 290 300 310 320 330 520 530 540 550 560 570 pF1KE4 TKGYYAAVEAKKERMSKHAQTFGAKQPTHQGGPAQDRGVYLSLLASLRTRAQLPVVVFTF .. .:... .. .. . : ..:: .:. ... . : ::..:.: CCDS39 EDNFNTAMQVLRDA----GDLAKGDQKGRKGGTKGPSNVF-KIVKMIMERNFQPVIIFSF 340 350 360 370 380 390 580 590 600 610 620 630 pF1KE4 SRGRCDEQASGLTSLDLTTSSEKSEIHLFLQRCLARLRGSDRQLPQVLHMSELLNRGLGV :. :. : .:.::..:. ::. .. .. . : :..:::: :. ::.::.:. CCDS39 SKKDCEAYALQMTKLDFNTDEEKKMVEEVFSNAIDCLSDEDKKLPQVEHVLPLLKRGIGI 400 410 420 430 440 450 640 650 660 670 680 690 pF1KE4 HHSGILPILKEIVEMLFSRGLVKVLFATETFAMGVNMPARTVVFDSMRKHDGSTFRDLLP ::.:.:::::: .:.:::.::.:.::::::::::.:::::::.: . :: ::. :: . CCDS39 HHGGLLPILKETIEILFSEGLIKALFATETFAMGINMPARTVLFTNARKFDGKDFRWISS 460 470 480 490 500 510 700 710 720 730 740 750 pF1KE4 GEYVQMAGRAGRRGLDPTGTVILLCKGRV-PEMADLHRMMMGKPSQLQSQFRLTYTMILN :::.::.:::::::.: : :::. .. : .. .... :. . :.: :.:::.:.:: CCDS39 GEYIQMSGRAGRRGMDDRGIVILMVDEKMSPTIG--KQLLKGSADPLNSAFHLTYNMVLN 520 530 540 550 560 570 760 770 780 790 800 810 pF1KE4 LLRVDALRVEDMMKRSFSEFPSRKDSKAHEQALAELTKRLGALEEPDMTGQLVDLPEYYS ::::. . : :...:: .: . . . . . .. . . :. . .. ::. CCDS39 LLRVEEINPEYMLEKSFYQFQHYRAIPGVVEKVKNSEEQYNKIVIPNEESVVI----YYK 580 590 600 610 620 820 830 840 850 860 pF1KE4 WGEELTETQHMIQRRIMESVNGLKSLSAGRVVVVKNQEHHNALGVILQVSSNSTSR---- ..:.. . :.. : . : :. ::.: :::. . ::... :..:. . CCDS39 IRQQLAKLGKEIEEYIHKPKYCLPFLQPGRLVKVKNEGDDFGWGVVVNFSKKSNVKPNSG 630 640 650 660 670 680 870 880 890 900 910 920 pF1KE4 ------VFTTLVLCDKPLSQDPQDRGPATAEVPYPDDLVGFKLFLPEGPCDHTVVKLQPG : .:. :.: .. .. . .:. ::. : .: ..:.: CCDS39 ELDPLYVVEVLLRCSK---ESLKNSATEAAKPAKPDEK-GEMQVVP------VLVHL--- 690 700 710 720 730 930 940 950 960 970 980 pF1KE4 DMAAITTKVLRVNGEKILEDFSKRQQPKFKKDPPLAAVTTAVQELLRLAQAHPAGPPTLD ..::.. .:. : :. ..:: .: ..::. . : : : :: CCDS39 -LSAISS--VRLYIPKDLRPVDNRQ-----------SVLKSIQEV---QKRFPDGIPLLD 740 750 760 770 990 1000 1010 1020 1030 1040 pF1KE4 PVNDLQLKDMSVVEGGLRARKLEELIQGAQCVHSPRFPAQYLKLRERMQIQKEMERL-RF :..:. ..:... . ... .:. . . ..: . . : ... :: ... : CCDS39 PIDDMGIQDQGLKKVIQKVEAFEHRMYSHPLHNDPNLETVYTLCEKKAQIAIDIKSAKRE 780 790 800 810 820 830 1050 1060 1070 1080 1090 1100 pF1KE4 LLSDQSLLLLPEYHQRVEVLRTLGYVDEVGTVKLAGRVACAMSS-HELLLTELMFDNALS : . ...: . : . : .::: ::.. .... ::::: .:: ::::::.::.. .. CCDS39 LKKARTVLQMDELKCRKRVLRRLGFATSSDVIEMKGRVACEISSADELLLTEMMFNGLFN 840 850 860 870 880 890 1110 1120 1130 1140 1150 1160 pF1KE4 TLRPEEIAALLSGLVCQSPGDAGDQLPNTLKQGIERVRAVAKRIGEVQVACGLNQTVEEF : :. .:::: .: : .. .: . : ..... ::::..:.. :. : . CCDS39 DLSAEQATALLSCFVFQENSSEMPKLTEQLAGPLRQMQECAKRIAKVSAEAKLEIDEETY 900 910 920 930 940 950 1170 1180 1190 1200 1210 1220 pF1KE4 VGELNFGLVEVVYEWARGMPFSELAGLSGTPEGLVVRCIQRLAEMCRSLRGAARLVGEPV .. .. :..::: :: : :... .. . :: ..::..:: :. :.. ::. .:. CCDS39 LSSFKPHLMDVVYTWATGATFAHICKMTDVFEGSIIRCMRRLEELLRQMCQAAKAIGNTE 960 970 980 990 1000 1010 1230 1240 pF1KE4 LGAKMETAATLLRRDIVFAASLYTQ : :. . : ..:::::::::: CCDS39 LENKFAEGITKIKRDIVFAASLYL 1020 1030 1040 1246 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 15:10:56 2016 done: Mon Nov 7 15:10:57 2016 Total Scan time: 3.880 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]