FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6396, 438 aa 1>>>pF1KE6396 438 - 438 aa - 438 aa Library: /omim/omim.rfq.tfa 60827320 residues in 85289 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.9625+/-0.000454; mu= 19.4432+/- 0.028 mean_var=64.6407+/-12.922, 0's: 0 Z-trim(108.7): 47 B-trim: 0 in 0/53 Lambda= 0.159522 statistics sampled from 16792 (16817) to 16792 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.544), E-opt: 0.2 (0.197), width: 16 Scan time: 6.580 The best scores are: opt bits E(85289) NP_062822 (OMIM: 312090) P3 protein isoform 1 prec ( 477) 983 235.6 2.2e-61 NP_001135864 (OMIM: 312090) P3 protein isoform 1 p ( 477) 983 235.6 2.2e-61 XP_011529503 (OMIM: 312090) PREDICTED: P3 protein ( 477) 983 235.6 2.2e-61 XP_011529502 (OMIM: 312090) PREDICTED: P3 protein ( 532) 983 235.6 2.4e-61 XP_005277970 (OMIM: 312090) PREDICTED: P3 protein ( 532) 983 235.6 2.4e-61 XP_006724910 (OMIM: 312090) PREDICTED: P3 protein ( 570) 983 235.6 2.5e-61 NP_001135863 (OMIM: 312090) P3 protein isoform 2 p ( 448) 926 222.4 1.9e-57 XP_006724911 (OMIM: 312090) PREDICTED: P3 protein ( 541) 926 222.5 2.2e-57 NP_000443 (OMIM: 601295,613291) ileal sodium/bile ( 348) 530 131.2 4.1e-30 NP_932069 (OMIM: 613366) solute carrier family 10 ( 377) 445 111.7 3.4e-24 NP_003040 (OMIM: 182396) sodium/bile acid cotransp ( 349) 410 103.6 8.5e-22 >>NP_062822 (OMIM: 312090) P3 protein isoform 1 precurso (477 aa) initn: 983 init1: 888 opt: 983 Z-score: 1223.1 bits: 235.6 E(85289): 2.2e-61 Smith-Waterman score: 983; 39.9% identity (72.1% similar) in 391 aa overlap (33-416:75-465) 10 20 30 40 50 pF1KE6 RKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYE---NKRPNSSH :. : .: :..::.: :. . NP_062 TASTSLSTAGGHTVPPTGGRYLSIGDGSVMEFEFPEDSEGIIVISSQYPGQANRTAPGPM 50 60 70 80 90 100 60 70 80 90 100 110 pF1KE6 LFVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIK : : : ..: . ::. . . .:.... . : . . ::: :.. :::: . NP_062 LRVTSLDTEVLTIKNVSAITWGGGGGFVVSIHSGLAGLAPLHIQLVDAHEAPPTLIEERR 110 120 130 140 150 160 120 130 140 150 160 170 pF1KE6 NVKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPL . .:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . : NP_062 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ 170 180 190 200 210 220 180 190 200 210 220 230 pF1KE6 PVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLA :..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: ::: NP_062 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA 230 240 250 260 270 280 240 250 260 270 280 290 pF1KE6 ILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRI : :: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: .. NP_062 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKL 290 300 310 320 330 340 300 310 320 330 340 350 pF1KE6 PEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFA :. ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .: NP_062 PKFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLA 350 360 370 380 390 400 360 370 380 390 400 410 pF1KE6 KVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLII ::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: .. NP_062 TCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALV 410 420 430 440 450 460 420 430 pF1KE6 LVYKAKKRCIFFLQDKRKRNFLI . NP_062 IGHFIYSSLFPVP 470 >>NP_001135864 (OMIM: 312090) P3 protein isoform 1 precu (477 aa) initn: 983 init1: 888 opt: 983 Z-score: 1223.1 bits: 235.6 E(85289): 2.2e-61 Smith-Waterman score: 983; 39.9% identity (72.1% similar) in 391 aa overlap (33-416:75-465) 10 20 30 40 50 pF1KE6 RKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYE---NKRPNSSH :. : .: :..::.: :. . NP_001 TASTSLSTAGGHTVPPTGGRYLSIGDGSVMEFEFPEDSEGIIVISSQYPGQANRTAPGPM 50 60 70 80 90 100 60 70 80 90 100 110 pF1KE6 LFVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIK : : : ..: . ::. . . .:.... . : . . ::: :.. :::: . NP_001 LRVTSLDTEVLTIKNVSAITWGGGGGFVVSIHSGLAGLAPLHIQLVDAHEAPPTLIEERR 110 120 130 140 150 160 120 130 140 150 160 170 pF1KE6 NVKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPL . .:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . : NP_001 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ 170 180 190 200 210 220 180 190 200 210 220 230 pF1KE6 PVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLA :..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: ::: NP_001 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA 230 240 250 260 270 280 240 250 260 270 280 290 pF1KE6 ILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRI : :: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: .. NP_001 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKL 290 300 310 320 330 340 300 310 320 330 340 350 pF1KE6 PEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFA :. ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .: NP_001 PKFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLA 350 360 370 380 390 400 360 370 380 390 400 410 pF1KE6 KVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLII ::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: .. NP_001 TCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALV 410 420 430 440 450 460 420 430 pF1KE6 LVYKAKKRCIFFLQDKRKRNFLI . NP_001 IGHFIYSSLFPVP 470 >>XP_011529503 (OMIM: 312090) PREDICTED: P3 protein isof (477 aa) initn: 983 init1: 888 opt: 983 Z-score: 1223.1 bits: 235.6 E(85289): 2.2e-61 Smith-Waterman score: 983; 39.9% identity (72.1% similar) in 391 aa overlap (33-416:75-465) 10 20 30 40 50 pF1KE6 RKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYE---NKRPNSSH :. : .: :..::.: :. . XP_011 TASTSLSTAGGHTVPPTGGRYLSIGDGSVMEFEFPEDSEGIIVISSQYPGQANRTAPGPM 50 60 70 80 90 100 60 70 80 90 100 110 pF1KE6 LFVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIK : : : ..: . ::. . . .:.... . : . . ::: :.. :::: . XP_011 LRVTSLDTEVLTIKNVSAITWGGGGGFVVSIHSGLAGLAPLHIQLVDAHEAPPTLIEERR 110 120 130 140 150 160 120 130 140 150 160 170 pF1KE6 NVKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPL . .:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . : XP_011 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ 170 180 190 200 210 220 180 190 200 210 220 230 pF1KE6 PVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLA :..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: ::: XP_011 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA 230 240 250 260 270 280 240 250 260 270 280 290 pF1KE6 ILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRI : :: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: .. XP_011 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKL 290 300 310 320 330 340 300 310 320 330 340 350 pF1KE6 PEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFA :. ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .: XP_011 PKFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLA 350 360 370 380 390 400 360 370 380 390 400 410 pF1KE6 KVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLII ::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: .. XP_011 TCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALV 410 420 430 440 450 460 420 430 pF1KE6 LVYKAKKRCIFFLQDKRKRNFLI . XP_011 IGHFIYSSLFPVP 470 >>XP_011529502 (OMIM: 312090) PREDICTED: P3 protein isof (532 aa) initn: 983 init1: 888 opt: 983 Z-score: 1222.4 bits: 235.6 E(85289): 2.4e-61 Smith-Waterman score: 983; 39.9% identity (72.1% similar) in 391 aa overlap (33-416:130-520) 10 20 30 40 50 pF1KE6 RKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYE---NKRPNSSH :. : .: :..::.: :. . XP_011 TASTSLSTAGGHTVPPTGGRYLSIGDGSVMEFEFPEDSEGIIVISSQYPGQANRTAPGPM 100 110 120 130 140 150 60 70 80 90 100 110 pF1KE6 LFVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIK : : : ..: . ::. . . .:.... . : . . ::: :.. :::: . XP_011 LRVTSLDTEVLTIKNVSAITWGGGGGFVVSIHSGLAGLAPLHIQLVDAHEAPPTLIEERR 160 170 180 190 200 210 120 130 140 150 160 170 pF1KE6 NVKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPL . .:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . : XP_011 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ 220 230 240 250 260 270 180 190 200 210 220 230 pF1KE6 PVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLA :..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: ::: XP_011 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA 280 290 300 310 320 330 240 250 260 270 280 290 pF1KE6 ILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRI : :: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: .. XP_011 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKL 340 350 360 370 380 390 300 310 320 330 340 350 pF1KE6 PEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFA :. ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .: XP_011 PKFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLA 400 410 420 430 440 450 360 370 380 390 400 410 pF1KE6 KVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLII ::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: .. XP_011 TCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALV 460 470 480 490 500 510 420 430 pF1KE6 LVYKAKKRCIFFLQDKRKRNFLI . XP_011 IGHFIYSSLFPVP 520 530 >>XP_005277970 (OMIM: 312090) PREDICTED: P3 protein isof (532 aa) initn: 983 init1: 888 opt: 983 Z-score: 1222.4 bits: 235.6 E(85289): 2.4e-61 Smith-Waterman score: 983; 39.9% identity (72.1% similar) in 391 aa overlap (33-416:130-520) 10 20 30 40 50 pF1KE6 RKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYE---NKRPNSSH :. : .: :..::.: :. . XP_005 TASTSLSTAGGHTVPPTGGRYLSIGDGSVMEFEFPEDSEGIIVISSQYPGQANRTAPGPM 100 110 120 130 140 150 60 70 80 90 100 110 pF1KE6 LFVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIK : : : ..: . ::. . . .:.... . : . . ::: :.. :::: . XP_005 LRVTSLDTEVLTIKNVSAITWGGGGGFVVSIHSGLAGLAPLHIQLVDAHEAPPTLIEERR 160 170 180 190 200 210 120 130 140 150 160 170 pF1KE6 NVKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPL . .:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . : XP_005 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ 220 230 240 250 260 270 180 190 200 210 220 230 pF1KE6 PVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLA :..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: ::: XP_005 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA 280 290 300 310 320 330 240 250 260 270 280 290 pF1KE6 ILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRI : :: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: .. XP_005 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKL 340 350 360 370 380 390 300 310 320 330 340 350 pF1KE6 PEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFA :. ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .: XP_005 PKFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLA 400 410 420 430 440 450 360 370 380 390 400 410 pF1KE6 KVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLII ::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: .. XP_005 TCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALV 460 470 480 490 500 510 420 430 pF1KE6 LVYKAKKRCIFFLQDKRKRNFLI . XP_005 IGHFIYSSLFPVP 520 530 >>XP_006724910 (OMIM: 312090) PREDICTED: P3 protein isof (570 aa) initn: 983 init1: 888 opt: 983 Z-score: 1222.0 bits: 235.6 E(85289): 2.5e-61 Smith-Waterman score: 983; 39.9% identity (72.1% similar) in 391 aa overlap (33-416:168-558) 10 20 30 40 50 pF1KE6 RKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYE---NKRPNSSH :. : .: :..::.: :. . XP_006 TASTSLSTAGGHTVPPTGGRYLSIGDGSVMEFEFPEDSEGIIVISSQYPGQANRTAPGPM 140 150 160 170 180 190 60 70 80 90 100 110 pF1KE6 LFVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIK : : : ..: . ::. . . .:.... . : . . ::: :.. :::: . XP_006 LRVTSLDTEVLTIKNVSAITWGGGGGFVVSIHSGLAGLAPLHIQLVDAHEAPPTLIEERR 200 210 220 230 240 250 120 130 140 150 160 170 pF1KE6 NVKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPL . .:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . : XP_006 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ 260 270 280 290 300 310 180 190 200 210 220 230 pF1KE6 PVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLA :..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: ::: XP_006 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA 320 330 340 350 360 370 240 250 260 270 280 290 pF1KE6 ILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRI : :: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: .. XP_006 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKL 380 390 400 410 420 430 300 310 320 330 340 350 pF1KE6 PEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFA :. ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .: XP_006 PKFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLA 440 450 460 470 480 490 360 370 380 390 400 410 pF1KE6 KVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLII ::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: .. XP_006 TCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALV 500 510 520 530 540 550 420 430 pF1KE6 LVYKAKKRCIFFLQDKRKRNFLI . XP_006 IGHFIYSSLFPVP 560 570 >>NP_001135863 (OMIM: 312090) P3 protein isoform 2 precu (448 aa) initn: 968 init1: 888 opt: 926 Z-score: 1152.5 bits: 222.4 E(85289): 1.9e-57 Smith-Waterman score: 926; 42.7% identity (76.1% similar) in 330 aa overlap (91-416:107-436) 70 80 90 100 110 120 pF1KE6 FVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIKN ::. . :. . .: :.. :::: .. NP_001 EFPEDSEGIIVISSQYPGQANRTAPGPMLRVTSLDTEVLTIKNLVDAHEAPPTLIEERRD 80 90 100 110 120 130 130 140 150 160 170 pF1KE6 VKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPLP .:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . : : NP_001 FCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQP 140 150 160 170 180 190 180 190 200 210 220 230 pF1KE6 VILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLAI ..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: :::: NP_001 MLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLAI 200 210 220 230 240 250 240 250 260 270 280 290 pF1KE6 LMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRIP :: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: ..: NP_001 SMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKLP 260 270 280 290 300 310 300 310 320 330 340 350 pF1KE6 EKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFAK . ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .: NP_001 KFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLAT 320 330 340 350 360 370 360 370 380 390 400 410 pF1KE6 VCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLIIL ::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: ... NP_001 CLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALVI 380 390 400 410 420 430 420 430 pF1KE6 VYKAKKRCIFFLQDKRKRNFLI NP_001 GHFIYSSLFPVP 440 >>XP_006724911 (OMIM: 312090) PREDICTED: P3 protein isof (541 aa) initn: 922 init1: 888 opt: 926 Z-score: 1151.4 bits: 222.5 E(85289): 2.2e-57 Smith-Waterman score: 926; 42.7% identity (76.1% similar) in 330 aa overlap (91-416:200-529) 70 80 90 100 110 120 pF1KE6 FVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIKN ::. . :. . .: :.. :::: .. XP_006 EFPEDSEGIIVISSQYPGQANRTAPGPMLRVTSLDTEVLTIKNLVDAHEAPPTLIEERRD 170 180 190 200 210 220 130 140 150 160 170 pF1KE6 VKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPLP .:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . : : XP_006 FCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQP 230 240 250 260 270 280 180 190 200 210 220 230 pF1KE6 VILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLAI ..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: :::: XP_006 MLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLAI 290 300 310 320 330 340 240 250 260 270 280 290 pF1KE6 LMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRIP :: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: ..: XP_006 SMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKLP 350 360 370 380 390 400 300 310 320 330 340 350 pF1KE6 EKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFAK . ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .: XP_006 KFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLAT 410 420 430 440 450 460 360 370 380 390 400 410 pF1KE6 VCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLIIL ::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: ... XP_006 CLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALVI 470 480 490 500 510 520 420 430 pF1KE6 VYKAKKRCIFFLQDKRKRNFLI XP_006 GHFIYSSLFPVP 530 540 >>NP_000443 (OMIM: 601295,613291) ileal sodium/bile acid (348 aa) initn: 456 init1: 368 opt: 530 Z-score: 661.6 bits: 131.2 E(85289): 4.1e-30 Smith-Waterman score: 530; 32.6% identity (63.2% similar) in 285 aa overlap (143-424:37-314) 120 130 140 150 160 170 pF1KE6 RLIEEIKNVKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQTVWK .: ..: :.... .::..:.. : : NP_000 CVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMFS---MGCNVEIKKFLGHIK 10 20 30 40 50 60 180 190 200 210 220 230 pF1KE6 RPLPVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDF :: . .: . :: .::. ::.:: . :: :.. :::: .. ..: .:::. NP_000 RPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCCPGGTASNILAYWVDGDM 70 80 90 100 110 120 240 250 260 270 280 290 pF1KE6 TLAILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIK :.. :: :::::: :::. ::... ::.. :: ..: ..:. ..::::::. .. NP_000 DLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSIVIPYDNIGTSLVALVVPVSIGMFVN 130 140 150 160 170 180 300 310 320 330 340 pF1KE6 HRIPEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNL---EVILLGLLVPALGLL :. :.:: .:: .. : . : : .:: .. .. . .. ..: . :. : NP_000 HKWPQKA----KIILKIGSIAGAILIVLIAVVGGILYQSAWIIAPKLWIIGTIFPVAGYS 190 200 210 220 230 350 360 370 380 390 400 pF1KE6 FGYSFAKVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGC .:. .:.. :: :.:::.:.:: :. : ...:::: . :.. . :. .. . NP_000 LGFLLARIAGLPWYRCRTVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIFQLA 240 250 260 270 280 290 410 420 430 pF1KE6 EMLLIILVYKAKKRCIFFLQDKRKRNFLI ... : : :.: NP_000 FAAIFLGFYVAYKKCHGKNKAEIPESKENGTEPESSFYKANGGFQPDEK 300 310 320 330 340 >>NP_932069 (OMIM: 613366) solute carrier family 10 memb (377 aa) initn: 371 init1: 334 opt: 445 Z-score: 555.3 bits: 111.7 E(85289): 3.4e-24 Smith-Waterman score: 445; 27.4% identity (63.7% similar) in 292 aa overlap (137-423:26-313) 110 120 130 140 150 160 pF1KE6 SEGRQERLIEEIKNVKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAF--GCKIEL .: . .... .. .... : ::..:. NP_932 MRANCSSSSACPANSSEEELPVGLEVHGNLELVFTVVSTVMMGLLMFSLGCSVEI 10 20 30 40 50 170 180 190 200 210 220 pF1KE6 QLFQTVWKRPLPVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLF . . . .:: . .: . :: :::: ..::. .: .::..:.. :::: . .: NP_932 RKLWSHIRRPWGIAVGLLCQFGLMPFTAYLLAISFSLKPVQAIAVLIMGCCPGGTISNIF 60 70 80 90 100 110 230 240 250 260 270 280 pF1KE6 ALLLDGDFTLAILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVP .. .:::. :.: :: ::. :: :::. :.:. .:. .. :: ..: ::. . .: NP_932 TFWVDGDMDLSISMTTCSTVAALGMMPLCIYLYTWSWSLQQNLTIPYQNIGITLVCLTIP 120 130 140 150 160 170 290 300 310 320 330 340 pF1KE6 VSIGIVIKHRIPEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTD-NLEVILL--GL :..:. ...: :...... .: .. .:..: . ..:.:. : . : .. :: .. NP_932 VAFGVYVNYRWPKQSKIILKIGAVVGGVLLLV----VAVAGVVLAKGSWNSDITLLTISF 180 190 200 210 220 230 350 360 370 380 390 400 pF1KE6 LVPALGLLFGYSFAKVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPF . : .: . :. .: :.:...:.: : . ....:::: . :. NP_932 IFPLIGHVTGFLLALFTHQSWQRCRTISLETGAQNIQMCITMLQLSFTAEHLVQMLSFPL 240 250 260 270 280 290 410 420 430 pF1KE6 TVAMCSGCEMLLIILVYKAKKRCIFFLQDKRKRNFLI . .. . . .::. .:.. :: NP_932 AYGLFQLIDGFLIVAAYQTYKRRLKNKHGKKNSGCTEVCHTRKSTSSRETNAFLEVNEEG 300 310 320 330 340 350 438 residues in 1 query sequences 60827320 residues in 85289 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 12:54:19 2016 done: Tue Nov 8 12:54:20 2016 Total Scan time: 6.580 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]