FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2081, 754 aa 1>>>pF1KE2081 754 - 754 aa - 754 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 12.2840+/-0.00134; mu= -10.4524+/- 0.081 mean_var=439.9019+/-88.367, 0's: 0 Z-trim(113.0): 171 B-trim: 247 in 1/52 Lambda= 0.061150 statistics sampled from 13476 (13641) to 13476 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.713), E-opt: 0.2 (0.419), width: 16 Scan time: 4.590 The best scores are: opt bits E(32554) CCDS2235.1 PPIG gene_id:9360|Hs108|chr2 ( 754) 4981 454.4 3.1e-127 CCDS2702.1 NKTR gene_id:4820|Hs108|chr3 (1462) 1460 144.0 1.6e-33 CCDS3801.1 PPID gene_id:5481|Hs108|chr4 ( 370) 735 79.5 1e-14 CCDS10191.1 PPIB gene_id:5479|Hs108|chr15 ( 216) 604 67.8 2.1e-11 CCDS469.1 PPIH gene_id:10465|Hs108|chr1 ( 177) 579 65.5 8.3e-11 >>CCDS2235.1 PPIG gene_id:9360|Hs108|chr2 (754 aa) initn: 4981 init1: 4981 opt: 4981 Z-score: 2397.8 bits: 454.4 E(32554): 3.1e-127 Smith-Waterman score: 4981; 99.9% identity (100.0% similar) in 754 aa overlap (1-754:1-754) 10 20 30 40 50 60 pF1KE2 MGIKVQRPRCFFDIAINNQPAGRVVFELFSDVCPKTCENFRCLCTGEKGTGKSTQKPLHY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 MGIKVQRPRCFFDIAINNQPAGRVVFELFSDVCPKTCENFRCLCTGEKGTGKSTQKPLHY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 KSCLFHRVVKDFMVQGGDFSEGNGRGGESIYGGFFEDESFAVKHNKEFLLSMANRGKDTN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 KSCLFHRVVKDFMVQGGDFSEGNGRGGESIYGGFFEDESFAVKHNKEFLLSMANRGKDTN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 GSQFFITTKPTPHLDGHHVVFGQVISGQEVVREIENQKTDAASKPFAEVRILSCGELIPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 GSQFFITTKPTPHLDGHHVVFGQVISGQEVVREIENQKTDAASKPFAEVRILSCGELIPK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 SKVKKEEKKRHKSSSSSSSSSSDSDSSSDSQSSSDSSDSESATEEKSKKRKKKHRKNSRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 SKVKKEEKKRHKSSSSSSSSSSDSDSSSDSQSSSDSSDSESATEEKSKKRKKKHRKNSRK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 HKKEKKKRKKSKKSASSESEAENLEAQPQSTVRPEEIPPIPENRFLMRKSPPKADEKERK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 HKKEKKKRKKSKKSASSESEAENLEAQPQSTVRPEEIPPIPENRFLMRKSPPKADEKERK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 NRERERERECNPPNSQPASYQRRLLVTRSGRKIKGRGPRRYRTPSRSRSRDRFRRSETPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 NRERERERECNPPNSQPASYQRRLLVTRSGRKIKGRGPRRYRTPSRSRSRDRFRRSETPP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 HWRQEMQRAQRMRVSSGERWIKGDKSELNEIKENQRSPVRVKERKITDHRNVSESPNRKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 HWRQEMQRAQRMRVSSGERWIKGDKSELNEIKENQRSPVRVKERKITDHRNVSESPNRKN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 EKEKKVKDHKSNSKERDIRRNSEKEDKYKNKVKKRAKSKSRSKSKEKSKSKERDSKHNRN ::::::::::::::::::::::::.::::::::::::::::::::::::::::::::::: CCDS22 EKEKKVKDHKSNSKERDIRRNSEKDDKYKNKVKKRAKSKSRSKSKEKSKSKERDSKHNRN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 EEKRMRSRSKGRDHENVKEKEKQSDSKGKDQERSRSKEKSKQLESKSNEHDHSKSKEKDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 EEKRMRSRSKGRDHENVKEKEKQSDSKGKDQERSRSKEKSKQLESKSNEHDHSKSKEKDR 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 RAQSRSRECDITKGKHSYNSRTRERSRSRDRSRRVRSRTHDRDRSRSKEYHRYREQEYRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 RAQSRSRECDITKGKHSYNSRTRERSRSRDRSRRVRSRTHDRDRSRSKEYHRYREQEYRR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE2 RGRSRSRERRTPPGRSRSKDRRRRRRDSRSSEREESQSRNKDKYRNQESKSSHRKENSES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 RGRSRSRERRTPPGRSRSKDRRRRRRDSRSSEREESQSRNKDKYRNQESKSSHRKENSES 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE2 EKRMYSKSRDHNSSNNSREKKADRDQSPFSKIKQSSQDNELKSSMLKNKEDEKIRSSVEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS22 EKRMYSKSRDHNSSNNSREKKADRDQSPFSKIKQSSQDNELKSSMLKNKEDEKIRSSVEK 670 680 690 700 710 720 730 740 750 pF1KE2 ENQKSKGQENDHVHEKNKKFDHESSPGTDEDKSG :::::::::::::::::::::::::::::::::: CCDS22 ENQKSKGQENDHVHEKNKKFDHESSPGTDEDKSG 730 740 750 >>CCDS2702.1 NKTR gene_id:4820|Hs108|chr3 (1462 aa) initn: 1500 init1: 1038 opt: 1460 Z-score: 715.2 bits: 144.0 E(32554): 1.6e-33 Smith-Waterman score: 1612; 41.5% identity (64.8% similar) in 778 aa overlap (1-742:1-735) 10 20 30 40 50 60 pF1KE2 MGIKVQRPRCFFDIAINNQPAGRVVFELFSDVCPKTCENFRCLCTGEKGTGKSTQKPLHY :: . .::.: ::: :: .:.::..:.::::.:::::.:: :::.:::: ::.: : : : CCDS27 MGAQ-DRPQCHFDIEINREPVGRIMFQLFSDICPKTCKNFLCLCSGEKGLGKTTGKKLCY 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 KSCLFHRVVKDFMVQGGDFSEGNGRGGESIYGGFFEDESFAVKHNKEFLLSMANRGKDTN :. ::::::.::.::::::::::.::::::::.:.::.: .::.. :::::::::: :: CCDS27 KGSTFHRVVKNFMIQGGDFSEGNGKGGESIYGGYFKDENFILKHDRAFLLSMANRGKHTN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 GSQFFITTKPTPHLDGHHVVFGQVISGQEVVREIENQKTDAASKPFAEVRILSCGELIPK ::::::::::.::::: ::::: :::: ::...::: ::::::.:.:.::...:: : : CCDS27 GSQFFITTKPAPHLDGVHVVFGLVISGFEVIEQIENLKTDAASRPYADVRVIDCGVLATK 120 130 140 150 160 170 190 200 210 220 230 pF1KE2 SKVKKEEKKRHKSSSSSSSSSSDSDSSSDSQSSSDSSDSESATE-EKSKKRKKKHR---K : ::::.: . : .: ::::.:.:::.:: ::: : :.:..::.:.: : CCDS27 SIKDVFEKKRKKPTHSEGS-----DSSSNSSSSSESS-SESELEHERSRRRKHKRRPKVK 180 190 200 210 220 230 240 250 260 270 280 pF1KE2 NSRKHKKE----KKKRKK--------SKKSASSESEAENLEAQ-PQSTVRPEEIPPIPEN :.:..:: .. :.: :..: ..:... . :. . .::::::::.::: CCDS27 RSKKRRKEASSSEEPRNKHAMNPKGHSERSDTNEKRSVDSSAKREKPVVRPEEIPPVPEN 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE2 RFLMRKSPPKADEKERKNRERERERECNPPNSQPASYQRRLLVTRSGRKIKGRGPRRYRT :::.:.. : . : : . :. : ... :..::::::::: ::.: CCDS27 RFLLRRDMPVVTA----------EPEPKIPDVAPIVSDQKPSVSKSGRKIKGRGTIRYHT 300 310 320 330 340 350 360 370 380 390 pF1KE2 PSRSRS---RDRFRRSETPPHWRQEMQRAQRMRVSSGERWIKGDK------SELNEIKEN : :::: : :::::::..:::: . .: :::.: :::: :. .: . . CCDS27 PPRSRSCSESDDDDSSETPPHWKEEMQRLRAYRPPSGEKWSKGDKLSDPCSSRWDERSLS 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE2 QRSPVRVKERKITDHRNVSESPN-RKNEKEKKVKDHKSNSKERDIRRNSEKEDKYKNKVK ::: . .: .. .: . .: .:::::: .:...:.. :: .:. : CCDS27 QRSRSWSYNGYYSDLSTARHSGHHKKRRKEKKVKHKKKGKKQKHCRR-------HKQTKK 410 420 430 440 450 460 470 480 490 500 510 pF1KE2 KRAKSKSRSKSKEKSKSKERDSKHNRNEEKRMRSRSKGRDHENVKEKEKQSDSKGKDQER .: : . :.:::. : : . ..:. :: : . .:.. :. ..:: :: . CCDS27 RRILIPS---DIESSKSSTRRMKSSCDRERSSRSSSLS-SHHSSKRDWSKSD---KDVQS 460 470 480 490 500 520 530 540 550 560 570 pF1KE2 SRSKEKSKQLESKSNEHDHSKSKEKDRRAQSRSRECDITKGKHSYNSRTRERSRSRDRS- : .. . . .::: ::.: :..:::: : .: : .::.: .::: ..: CCDS27 SLTHSSRDSYRSKS----HSQSYS---RGSSRSR----TASKSSSHSRSRSKSRSSSKSG 510 520 530 540 550 580 590 600 610 620 630 pF1KE2 RRVRSRTHDRDRSRSKEYHRYREQEYRRRGRSRSRERRTPPGRSRSKDRRRRRRDSRSSE .: :. : . . .. . : : ..... . : ... . :. CCDS27 HRKRASKSPRKTASQLSENKPVKTEPLRATMAQNENVVVQPVVAENIPVIPLSDSPPPSR 560 570 580 590 600 610 640 650 660 670 680 pF1KE2 REESQSRNKDKY-RNQE--SKSSHRKENSESEKRMYSKSRDHNSSNNSREKKADRDQSPF . .:. : .: : :: .:..: . . . : .:: ..:::... ::: . CCDS27 WKPGQKPWKPSYERIQEMKAKTTHLLPIQSTYSLANIKETGSSSSYHKREKNSESDQSTY 620 630 640 650 660 670 690 700 710 720 730 740 pF1KE2 SKIK----QSSQDNELKSSMLKNKEDEKIRS-SVEKENQKSKGQENDHVHEKNKKFDHES :: . .:: .. .:: .. :: :. . ...:.. ... : .:: :: CCDS27 SKYSDRSSESSPRSRSRSSRSRSYSRSYTRSRSLASSHSRSRSP-SSRSHSRNKYSDHSQ 680 690 700 710 720 730 750 pF1KE2 SPGTDEDKSG CCDS27 CSRSSSYTSISSDDGRRAKRRLRSSGKKNSVSHKKHSSSSEKTLHSKYVKGRDRSSCVRK 740 750 760 770 780 790 >>CCDS3801.1 PPID gene_id:5481|Hs108|chr4 (370 aa) initn: 773 init1: 712 opt: 735 Z-score: 377.6 bits: 79.5 E(32554): 1e-14 Smith-Waterman score: 735; 63.5% identity (80.6% similar) in 170 aa overlap (8-177:16-184) 10 20 30 40 50 pF1KE2 MGIKVQRPRCFFDIAINNQPAGRVVFELFSDVCPKTCENFRCLCTGEKGTGK :: :::. :... .::.:.:::.:. ::: :::: ::::::: :. CCDS38 MSHPSPQAKPSNPSNPRVFFDVDIGGERVGRIVLELFADIVPKTAENFRALCTGEKGIGH 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 STQKPLHYKSCLFHRVVKDFMVQGGDFSEGNGRGGESIYGGFFEDESFAVKHNKEFLLSM .: ::::.:.: :::..: ::.::::::. :: ::::::: ::::.: ::..: :::: CCDS38 TTGKPLHFKGCPFHRIIKKFMIQGGDFSNQNGTGGESIYGEKFEDENFHYKHDREGLLSM 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 ANRGKDTNGSQFFITTKPTPHLDGHHVVFGQVISGQEVVREIENQKTDAASKPFAEVRIL :: :..:::::::::: :::::::.::::::::.: :.: .:: .. . :: : CCDS38 ANAGRNTNGSQFFITTVPTPHLDGKHVVFGQVIKGIGVARILENVEVKGE-KPAKLCVIA 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 SCGELIPKSKVKKEEKKRHKSSSSSSSSSSDSDSSSDSQSSSDSSDSESATEEKSKKRKK :::: CCDS38 ECGELKEGDDGGIFPKDGSGDSHPDFPEDADIDLKDVDKILLITEDLKNIGNTFFKSQNW 180 190 200 210 220 230 >>CCDS10191.1 PPIB gene_id:5479|Hs108|chr15 (216 aa) initn: 614 init1: 484 opt: 604 Z-score: 318.3 bits: 67.8 E(32554): 2.1e-11 Smith-Waterman score: 604; 54.4% identity (75.1% similar) in 169 aa overlap (9-177:45-205) 10 20 30 pF1KE2 MGIKVQRPRCFFDIAINNQPAGRVVFELFSDVCPKTCE . .::. :... .:::.: ::. . ::: . CCDS10 AALIAGSVFFLLLPGPSAADEKKKGPKVTVKVYFDLRIGDEDVGRVIFGLFGKTVPKTVD 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE2 NFRCLCTGEKGTGKSTQKPLHYKSCLFHRVVKDFMVQGGDFSEGNGRGGESIYGGFFEDE :: : ::::: : ::. ::::.::::.:::::..:.: ::.:::: : :: CCDS10 NFVALATGEKGFG--------YKNSKFHRVIKDFMIQGGDFTRGDGTGGKSIYGERFPDE 80 90 100 110 120 100 110 120 130 140 150 pF1KE2 SFAVKHNKEFLLSMANRGKDTNGSQFFITTKPTPHLDGHHVVFGQVISGQEVVREIENQK .: .:: .:::: ::::::::::::: : :::.:::::.:. :.::::..:. : CCDS10 NFKLKHYGPGWVSMANAGKDTNGSQFFITTVKTAWLDGKHVVFGKVLEGMEVVRKVESTK 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE2 TDAASKPFAEVRILSCGELIPKSKVKKEEKKRHKSSSSSSSSSSDSDSSSDSQSSSDSSD ::. .::. .: : .::.. CCDS10 TDSRDKPLKDVIIADCGKIEVEKPFAIAKE 190 200 210 >>CCDS469.1 PPIH gene_id:10465|Hs108|chr1 (177 aa) initn: 603 init1: 423 opt: 579 Z-score: 307.5 bits: 65.5 E(32554): 8.3e-11 Smith-Waterman score: 579; 52.9% identity (71.8% similar) in 170 aa overlap (8-177:11-177) 10 20 30 40 50 pF1KE2 MGIKVQRPRCFFDIAINNQPAGRVVFELFSDVCPKTCENFRCLCTGEKGTGKSTQKP : :::..:..: .::. .:::.:: ::: :::: .:::: .. : CCDS46 MAVANSSPVNPVVFFDVSIGGQEVGRMKIELFADVVPKTAENFRQFCTGEF---RKDGVP 10 20 30 40 50 60 70 80 90 100 110 pF1KE2 LHYKSCLFHRVVKDFMVQGGDFSEGNGRGGESIYGGFFEDESFAVKHNKEFLLSMANRGK . ::. ::::.::::.::::: .:.: : ::: : : ::.: ..:. :::::: : CCDS46 IGYKGSTFHRVIKDFMIQGGDFVNGDGTGVASIYRGPFADENFKLRHSAPGLLSMANSGP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 DTNGSQFFITTKPTPHLDGHHVVFGQVISGQEVVREIENQKTDAASKPFAEVRILSCGEL .::: ::::: . :::.:::::..:.: :.:.::: : .:: : : .:::. CCDS46 STNGCQFFITCSKCDWLDGKHVVFGKIIDGLLVMRKIENVPTGPNNKPKLPVVISQCGEM 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 IPKSKVKKEEKKRHKSSSSSSSSSSDSDSSSDSQSSSDSSDSESATEEKSKKRKKKHRKN 754 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 18:13:11 2016 done: Sun Nov 6 18:13:11 2016 Total Scan time: 4.590 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]